AI:Googleの医療、xAI、Mistral

GoogleのヘルスケアAIにおける躍進

Googleは最近、年次イベント’The Check Up’でHealth AIのアップデートを発表し、多様なヘルスケアアプリケーションにAIを活用するという同社のコミットメントを示しました。これらのアップデートは、Google Searchでの健康関連クエリの強化から、AIを活用した創薬の効率を高めるように設計された新しい’オープン’AIモデルの導入にまで及びます。

Google Searchによる健康情報アクセスの強化

Googleは、AIと洗練された品質およびランキングシステムを導入して、幅広い健康関連トピックに関する’ナレッジパネル’の回答範囲を拡大しています。この拡張には、スペイン語、ポルトガル語、日本語など、複数の言語でのヘルスケアクエリのサポートが追加されており、最初はモバイルプラットフォームで提供されます。Searchはすでにインフルエンザや風邪などの一般的な健康上の懸念事項についてナレッジパネルの回答を提供していましたが、今回のアップデートにより、これらのパネルがカバーするトピックの範囲が大幅に拡大されます。

これに加えて、GoogleはSearchに’What People Suggest’と呼ばれる新機能を導入します。この機能は、同様の医療経験を共有した個人から得られた情報をユーザーに提示するように設計されています。この追加により、ユーザーは洞察を得るためのユニークな手段を得ることができます。ユーザーは、同じ症状を持つ他の人からの本物の視点をすばやく発見し、さらに詳しく調べるためのリンクも提供されます。’What People Suggest’は現在、米国内のモバイルデバイスで利用できます。

新しいAPIによる医療記録の効率化

Googleはまた、Androidデバイスと互換性のあるHealth Connectプラットフォーム用の新しい医療記録アプリケーションプログラミングインターフェース(API)をグローバルにリリースしました。これらのAPIにより、アプリケーションはアレルギー、投薬、予防接種、検査結果などの医療記録データを、標準化されたFHIR形式で読み書きできるようになります。これらの機能強化により、Health Connectは、アクティビティ、睡眠、栄養、バイタルサイン、そして今回の医療記録を含む50以上のデータタイプをサポートするようになります。この統合により、ユーザーの日常の健康データと医療提供者からの情報との間のシームレスな接続が促進されます。

AI Co-Scientist:仮想研究パートナー

Googleの画期的なイノベーションは、Gemini 2.0を基盤とする新しいシステムである’AI co-scientist’です。このシステムは、研究者や科学者のための’仮想科学的協力者’として構想されています。AI co-scientistは、研究者が広範な科学文献をナビゲートするのを支援し、それによって新しい仮説の生成を促進するように設計されています。膨大なデータセットと複雑な研究論文の分析を支援することにより、AI co-scientistは、専門家が新しいアイデアを発見し、研究活動を迅速化することを支援することを目的としています。Googleは、Imperial College London、Houston Methodist、Stanford Universityなどの機関と積極的に協力して、このツールの実用的な応用を模索しており、信頼できるテスタープログラムを開始する予定です。

TxGemma:創薬の加速

Googleはまた、AI主導の創薬の効率を高めることを目的としたGemmaベースのオープンモデルのコンパイルであるTxGemmaを発表しました。TxGemmaは、標準的なテキストと、低分子、化学物質、タンパク質など、さまざまな治療エンティティの構造の両方を理解する機能を備えています。TxGemmaのリリースは、近い将来に予定されています。

Capricorn AI Tool:小児腫瘍学の進歩

オランダのPrincess Maxima Center for Pediatric Oncologyとの協力により、GoogleはCapricornという名前のAIツールを開発しています。このツールは、特に小児腫瘍学において、AIを専門的な医療分野に適用するというGoogleの献身を強調しています。

AIのヘルスケアへの幅広い影響

Googleは以前、AIが世界の健康成果にプラスの影響を与えていることを強調しています。同社は、乳がん、肺がん、糖尿病性網膜症などの疾患の検出を支援するAIモデルを開発しました。2024年5月、Googleは、マルチモーダル医療アプリケーション向けに微調整されたGeminiモデルのファミリーであるMed-Geminiを発表しました。さらに、2024年6月、Googleは、モバイルおよびウェアラブルデバイス向けのPersonal Health Large Language Modelを発表しました。このGeminiの微調整バージョンは、センサーデータを解釈し、個人の睡眠とフィットネスのパターンに関するパーソナライズされた洞察と推奨事項を提供するように設計されています。

xAIによるHotshotの買収:生成AIビデオへの進出

Elon MuskのAIベンチャーであるxAIは、AIを活用したビデオ生成ツールを専門とするスタートアップであるHotshotを買収しました。この買収により、xAIは、生成AIビデオ分野の主要プラットフォームであるOpenAIのSoraと競合する立場になります。Hotshotは、3月14日に新しいビデオ作成の段階的な廃止を開始し、既存の顧客は3月30日までに作成したビデオをダウンロードできるとウェブサイトで発表しました。

Grok 3:xAIの野心的なAIチャットボット

2月19日、xAIは、Elon Muskが’地球上で最も賢いAI’と宣言したチャットボットの最新版であるGrok 3を発表しました。その後、同社は、2つの推論モデル、Grok 3 (Think)とGrok 3 Mini (Think)のベータリリースを発表しました。xAIは、以前の最先端モデルの10倍の計算能力を持つColossusスーパークラスターでトレーニングされたGrok 3は、推論、数学、コーディング、世界の知識、および指示に従うタスクにおいて大幅な改善を示していると述べました。

Mistral AIのMistral Small 3.1:コンパクトでパワフル

フランスのAIスタートアップであるMistral AIは、3月17日にMistral Small 3.1という名前の新しいオープンソースモデルを発表しました。同社は、このモデルがGoogleのGemma 3やOpenAIのGPT-4o Miniなどの同等のモデルを上回ると主張しており、それによって主に米国のテクノロジー大手によって支配されている市場での競争を激化させています。

Mistral Small 3.1は、テキストと画像の両方を240億のパラメーターで処理します。これは、主要なプロプライエタリモデルと比較して大幅に小さいサイズですが、それらのパフォーマンスと同等またはそれ以上です。Mistral AIは、Mistral Small 3.1が、さまざまな次元で主要な小型プロプライエタリモデルのパフォーマンスを満たすだけでなく、それを上回る最初のオープンソースモデルであると強調しました。

Mistral Small 3を基盤とするこの新しいモデルは、テキストパフォーマンスの向上、マルチモーダルな理解、および最大128,000トークンの拡張されたコンテキストウィンドウを誇ります。Mistral AIは、このモデルが毎秒150トークンの速度で情報を処理し、迅速な応答時間を必要とするアプリケーションに適していると主張しています。

Mistral Small 3.1の汎用性とアクセシビリティ

Mistral Small 3.1は、単一のRTX 4090または32GB RAMを搭載したMacなどのアクセス可能なハードウェアで実行するように設計されており、オンデバイスアプリケーションに非常に適しています。このモデルは、専門分野に合わせて微調整することができ、特に法律相談、医療診断、テクニカルサポートなどの分野で役立つ、非常に正確な主題の専門家を作成できます。

新しいモデルは、マルチモーダルな理解を必要とする幅広いエンタープライズおよびコンシューマーアプリケーション向けに調整されています。潜在的なユースケースには、ドキュメント検証、診断、オンデバイス画像処理、品質管理のための目視検査、セキュリティシステムにおけるオブジェクト検出、画像ベースのカスタマーサポート、および汎用アシスタンスが含まれます。

Mistral OCR:高度なドキュメント理解

3月上旬、Mistral AIは、同社が’世界最高のドキュメント理解API’と宣伝するMistral OCRを発表しました。Mistral OCRは、複雑なドキュメントからテキスト、表、数式、画像を抽出できるOptical Character Recognition (OCR) APIです。Mistral AIは、このテクノロジーが組織が膨大な情報リポジトリを処理および利用する方法に革命をもたらすと信じています。

同社によると、Mistral OCRは1分あたり最大2000ページを処理し、多言語およびマルチモーダル機能をサポートし、AIワークフローへのシームレスな統合のためにJSONなどの構造化された出力を提供します。内部テストでは、Mistral OCRが、特にスキャンされたドキュメント、数学的内容、および多言語テキストについて、テキスト抽出の精度で市場をリードしていることが示されています。従来のOCRソリューションとは異なり、埋め込み画像も抽出するため、科学研究、規制当局への提出、および歴史的文書のデジタル化に最適です。

Mistral AIは、OCRがすでに企業や研究機関が文献をデジタル化し、顧客サービスを合理化し、歴史的アーカイブを保存するのを支援していると報告しています。さらに、OCRは、企業が技術文献、技術図面、講義ノート、プレゼンテーション、規制当局への提出などを、インデックス化された、回答可能な形式に変換するのを支援しています。Mistral OCRの機能は、le Chatで無料トライアルとして利用でき、同社は今後数週間でモデルがさらに改善されることを期待しています。これらの継続的な開発は、AIの動的な性質と、多様な産業を再構築する可能性を反映しています。