Google 在醫療保健 AI 領域的進展
Google 最近在其年度 ‘The Check Up’ 活動中推出了一系列 Health AI 更新,展示了該公司致力於利用 AI 進行各種醫療保健應用。這些更新涵蓋了從增強 Google Search 中與健康相關的查詢,到引入旨在提高 AI 驅動藥物發現效率的新 ‘開放’ AI 模型。
透過 Google Search 增強健康資訊的獲取
Google 正在部署 AI 和複雜的品質和排名系統,以擴大各種健康相關主題的 ‘知識面板’ 答案的範圍。此擴展包括在多種語言(例如西班牙語、葡萄牙語和日語)中添加對醫療保健查詢的支援,最初在行動平台上。雖然 Search 已經為常見的健康問題(如流感或普通感冒)提供了知識面板答案,但此更新顯著擴大了這些面板涵蓋的主題範圍。
除此之外,Google 在 Search 中引入了一項名為 ‘What People Suggest’ 的新功能。此功能旨在向用戶呈現來自具有相似醫療經驗的個人的資訊。此新增功能為用戶提供了一個獲取見解的獨特途徑。它允許用戶快速發現來自其他具有相同狀況的人的真實觀點,並附有連結以供進一步探索。’What People Suggest’ 目前在美國的行動裝置上可用。
使用新的 API 簡化醫療記錄
Google 還在全球範圍內推出了適用於其 Health Connect 平台的新醫療記錄應用程式介面 (API),與 Android 裝置相容。這些 API 使應用程式能夠讀取和寫入醫療記錄數據,包括過敏、藥物、免疫接種和實驗室結果,所有這些都採用標準化的 FHIR 格式。這些增強功能使 Health Connect 支援超過 50 種數據類型,涵蓋活動、睡眠、營養、生命徵象,現在還包括醫療記錄。這種整合促進了用戶的日常健康數據與來自其醫療保健提供者的資訊之間的無縫連接。
AI 共同科學家:虛擬研究夥伴
Google 的一項突破性創新是 ‘AI 共同科學家’,這是一個由 Gemini 2.0 支持的新系統。該系統被設想為研究人員和科學家的 ‘虛擬科學合作者’。AI 共同科學家旨在協助研究人員瀏覽大量的科學文獻,從而促進新假設的產生。通過協助分析大量數據集和複雜的研究論文,AI 共同科學家旨在幫助專家發現新想法並加快他們的研究工作。Google 正在積極與倫敦帝國學院、休斯頓衛理公會醫院和斯坦福大學等機構合作,探索該工具的實際應用,並打算啟動一個受信任的測試人員計劃。
TxGemma:加速藥物發現
Google 還推出了 TxGemma,這是一個基於 Gemma 的開放模型彙編,旨在提高 AI 驅動藥物發現的效率。TxGemma 具有理解標準文本和各種治療實體(包括小分子、化學物質和蛋白質)結構的能力。TxGemma 預計在不久的將來發布。
Capricorn AI 工具:推進兒科腫瘤學
Google 與荷蘭的 Princess Maxima 兒科腫瘤學中心合作,一直在開發一種名為 Capricorn 的 AI 工具。該工具強調了 Google 致力於將 AI 應用於專業醫療領域,特別是兒科腫瘤學。
AI 對醫療保健的更廣泛影響
Google 此前曾強調 AI 對全球健康結果的積極影響。該公司已開發出 AI 模型來協助檢測乳腺癌、肺癌和糖尿病視網膜病變等疾病。2024 年 5 月,Google 宣布推出 Med-Gemini,這是一系列針對多模態醫療應用進行微調的 Gemini 模型。此外,在 2024 年 6 月,Google 推出了適用於行動和穿戴式裝置的 Personal Health Large Language Model。這個經過微調的 Gemini 版本旨在解釋傳感器數據,並提供有關個人睡眠和健身模式的個性化見解和建議。
xAI 收購 Hotshot:進軍生成式 AI 影片
Elon Musk 的 AI 公司 xAI 收購了 Hotshot,這是一家專注於 AI 驅動影片生成工具的新創公司。此次收購使 xAI 能夠與 OpenAI 的 Sora 競爭,Sora 是生成式 AI 影片領域的領先平台。Hotshot 在其網站上宣布,它於 3 月 14 日開始逐步停止新的影片創建,現有客戶可以在 3 月 30 日之前下載他們創建的影片。
Grok 3:xAI 雄心勃勃的 AI 聊天機器人
2 月 19 日,xAI 推出了 Grok 3,這是其聊天機器人的最新版本,Elon Musk 宣稱它是 ‘地球上最聰明的 AI’。隨後,該公司宣布推出兩個推理模型 Grok 3 (Think) 和 Grok 3 Mini (Think) 的 Beta 版。xAI 表示,Grok 3 在他們的 Colossus 超級集群上進行訓練,其計算能力是以前最先進模型的十倍,在推理、數學、編碼、世界知識和指令遵循任務方面表現出顯著的改進。
Mistral AI 的 Mistral Small 3.1:精巧而強大
法國 AI 新創公司 Mistral AI 於 3 月 17 日推出了一款新的開源模型,名為 Mistral Small 3.1。該公司聲稱,該模型超越了 Google 的 Gemma 3 和 OpenAI 的 GPT-4o Mini 等同類模型,從而加劇了主要由美國科技巨頭主導的市場的競爭。
Mistral Small 3.1 使用 240 億個參數處理文本和圖像——與領先的專有模型相比,尺寸明顯更小——同時匹配或超越它們的性能。Mistral AI 強調,Mistral Small 3.1 是第一個不僅滿足而且在各個方面超越領先的小型專有模型性能的開源模型。
基於 Mistral Small 3,這款新模型擁有增強的文本性能、多模態理解能力以及高達 128,000 個 token 的擴展上下文窗口。Mistral AI 聲稱該模型以每秒 150 個 token 的速度處理資訊,使其適用於需要快速響應時間的應用。
Mistral Small 3.1 的多功能性和可訪問性
Mistral Small 3.1 設計為可在單個 RTX 4090 或具有 32GB RAM 的 Mac 等硬體上運行,使其非常適合裝置端應用。該模型可以針對特定領域進行微調,從而能夠創建高度準確的主題專家,特別適用於法律諮詢、醫療診斷和技術支援等領域。
新模型專為需要多模態理解的廣泛企業和消費者應用而設計。潛在的用例包括文件驗證、診斷、裝置端圖像處理、品質控制的視覺檢查、安全系統中的物件檢測、基於圖像的客戶支援和通用協助。
Mistral OCR:進階文件理解
3 月初,Mistral AI 宣布推出 Mistral OCR,該公司稱其為 ‘世界上最好的文件理解 API’。Mistral OCR 是一種光學字元識別 (OCR) API,能夠從複雜文件中提取文本、表格、方程式和圖像。Mistral AI 相信這項技術將徹底改變組織處理和利用大量資訊儲存庫的方式。
據該公司稱,Mistral OCR 每分鐘最多可處理 2000 頁,支援多語言和多模態功能,並提供 JSON 等結構化輸出,以便無縫整合到 AI 工作流程中。內部測試表明,Mistral OCR 在文本提取準確性方面領先市場,尤其是對於掃描文件、數學內容和多語言文本。與傳統的 OCR 解決方案不同,它還提取嵌入的圖像,使其成為科學研究、監管文件和歷史文檔數位化的理想選擇。
Mistral AI 報告稱,OCR 已經在協助企業和研究機構數位化文獻、簡化客戶服務和保存歷史檔案。此外,OCR 正在幫助公司將技術文獻、工程圖紙、講義、演示文稿、監管文件等轉換為索引的、可回答的格式。Mistral OCR 功能可在 le Chat 上免費試用,該公司預計未來幾週將進一步改進該模型。這些持續的發展反映了 AI 的動態特性及其重塑不同行業的潛力。