谷歌在医疗AI领域的进展
谷歌最近在其年度’The Check Up’活动中发布了一系列健康AI更新,展示了该公司致力于利用AI进行各种医疗保健应用。这些更新涵盖了从增强Google Search中与健康相关的查询到引入新的’开放’AI模型,旨在提高AI驱动的药物发现的效率。
通过Google Search增强健康信息访问
谷歌正在部署AI和复杂的质量及排名系统,以扩大各种健康相关主题的’知识面板’答案的范围。此次扩展包括增加对多种语言(如西班牙语、葡萄牙语和日语)的医疗保健查询的支持,最初在移动平台上。虽然Search已经为流感或普通感冒等常见健康问题提供了知识面板答案,但此更新显著扩大了这些面板涵盖的主题范围。
除此之外,谷歌在Search中引入了一项名为’What People Suggest’的新功能。此功能旨在向用户展示来自具有相似医疗经历的个人的信息。这一新增功能为用户提供了一个获取见解的独特途径。它允许用户快速发现来自其他具有相同状况的人的真实观点,并附有链接以供进一步探索。’What People Suggest’目前在美国的移动设备上可用。
使用新的API简化医疗记录
谷歌还面向Android设备,在全球范围内推出了与其Health Connect平台兼容的新医疗记录应用程序编程接口(API)。这些API使应用程序能够读取和写入医疗记录数据,包括过敏、药物、免疫接种和实验室结果,所有这些都采用标准化的FHIR格式。这些增强功能使Health Connect支持超过50种数据类型,涵盖活动、睡眠、营养、生命体征,以及现在的医疗记录。这种集成促进了用户的日常健康数据与其医疗保健提供者的信息之间的无缝连接。
AI Co-Scientist:虚拟研究伙伴
谷歌的一项突破性创新是’AI co-scientist’,这是一个由Gemini 2.0支持的新系统。该系统被设想为研究人员和科学家的’虚拟科学合作者’。AI co-scientist旨在协助研究人员浏览大量的科学文献,从而促进新假设的产生。通过协助分析大量数据集和复杂的研究论文,AI co-scientist旨在帮助专家发现新想法并加快他们的研究工作。谷歌正在积极与伦敦帝国理工学院、休斯顿卫理公会医院和斯坦福大学等机构合作,探索该工具的实际应用,并计划启动一个可信测试者计划。
TxGemma:加速药物发现
谷歌还推出了TxGemma,这是一个基于Gemma的开放模型集合,旨在提高AI驱动的药物发现的效率。TxGemma能够理解标准文本和各种治疗实体(包括小分子、化学物质和蛋白质)的结构。TxGemma计划在不久的将来发布。
Capricorn AI工具:推进儿科肿瘤学
谷歌与荷兰的Princess Maxima儿科肿瘤学中心合作,一直在开发一个名为Capricorn的AI工具。该工具强调了谷歌致力于将AI应用于专业医疗领域,特别是在儿科肿瘤学方面。
AI对医疗保健的更广泛影响
谷歌此前曾强调AI对全球健康结果的积极影响。该公司已经开发了AI模型来帮助检测乳腺癌、肺癌和糖尿病视网膜病变等疾病。2024年5月,谷歌宣布了Med-Gemini,这是一个针对多模态医疗应用进行微调的Gemini模型系列。此外,在2024年6月,谷歌推出了用于移动和可穿戴设备的Personal Health Large Language Model。这个经过微调的Gemini版本旨在解释传感器数据,并提供有关个人睡眠和健身模式的个性化见解和建议。
xAI收购Hotshot:进军生成式AI视频
Elon Musk的AI企业xAI收购了Hotshot,这是一家专门从事AI驱动的视频生成工具的初创公司。此次收购使xAI能够与OpenAI的Sora竞争,后者是生成式AI视频领域的领先平台。Hotshot在其网站上宣布,它于3月14日开始逐步停止新的视频创建,现有客户可以在3月30日之前下载他们创建的视频。
Grok 3:xAI雄心勃勃的AI聊天机器人
2月19日,xAI发布了Grok 3,这是其聊天机器人的最新版本,Elon Musk宣称它是’地球上最聪明的AI’。随后,该公司宣布了两个推理模型Grok 3 (Think)和Grok 3 Mini (Think)的beta版本。xAI表示,Grok 3在其Colossus超级集群上进行训练,其计算能力是以前最先进模型的十倍,在推理、数学、编码、世界知识和指令跟随任务方面表现出显著的改进。
Mistral AI的Mistral Small 3.1:紧凑而强大
法国AI初创公司Mistral AI于3月17日推出了一个名为Mistral Small 3.1的新开源模型。该公司声称,该模型超越了Google的Gemma 3和OpenAI的GPT-4o Mini等同类模型,从而加剧了主要由美国科技巨头主导的市场的竞争。
Mistral Small 3.1处理文本和图像,参数为240亿——与领先的专有模型相比,尺寸明显更小——同时匹配或超越它们的性能。Mistral AI强调,Mistral Small 3.1是第一个不仅满足而且在各个方面超越领先的小型专有模型性能的开源模型。
基于Mistral Small 3,这个新模型拥有增强的文本性能、多模态理解能力以及高达128,000个token的扩展上下文窗口。Mistral AI声称该模型以每秒150个token的速度处理信息,使其适用于需要快速响应时间的应用。
Mistral Small 3.1的多功能性和可访问性
Mistral Small 3.1设计为可在单个RTX 4090或具有32GB RAM的Mac等硬件上运行,使其非常适合设备端应用。该模型可以针对特定领域进行微调,从而能够创建高度准确的学科专家,特别是在法律咨询、医疗诊断和技术支持等领域非常有用。
新模型专为需要多模态理解的广泛企业和消费者应用而设计。潜在的用例包括文档验证、诊断、设备端图像处理、质量控制的视觉检查、安全系统中的对象检测、基于图像的客户支持和通用辅助。
Mistral OCR:先进的文档理解
3月初,Mistral AI宣布了Mistral OCR,该公司称其为’世界上最好的文档理解API’。Mistral OCR是一个光学字符识别(OCR)API,能够从复杂文档中提取文本、表格、方程式和图像。Mistral AI相信这项技术将彻底改变组织处理和利用大量信息存储库的方式。
据该公司称,Mistral OCR每分钟最多可处理2000页,支持多语言和多模态功能,并提供JSON等结构化输出,以便无缝集成到AI工作流程中。内部测试表明,Mistral OCR在文本提取准确性方面处于市场领先地位,特别是对于扫描文档、数学内容和多语言文本。与传统的OCR解决方案不同,它还可以提取嵌入的图像,使其成为科学研究、监管文件和历史文档数字化的理想选择。
Mistral AI报告称,OCR已经在帮助企业和研究机构数字化文献、简化客户服务和保存历史档案。此外,OCR正在帮助公司将技术文献、工程图纸、讲义、演示文稿、监管文件等转换为可索引、可回答的格式。Mistral OCR功能可在le Chat上免费试用,该公司预计未来几周将进一步改进该模型。这些持续的发展反映了AI的动态特性及其重塑不同行业的潜力。