谷歌发布AI新模型加速药物研发

TxGemma:谷歌AI家族的专业分支

在年度健康主题活动“The Check Up”上,谷歌全面介绍了其在医疗保健领域的多样化研发工作。其中一项重要发布是推出了一系列专门为推动药物发现过程而设计的新型人工智能 (AI) 模型。

这些新模型统称为 TxGemma,是谷歌 Gemma 系列开源生成式 AI (GenAI) 模型的专业化扩展。Gemma 模型本身构建于谷歌尖端的 Gemini AI 平台之上,该平台的最新版本于 12 月发布。

TxGemma 工具包计划于本月晚些时候通过谷歌的 Health AI Developer Foundations 计划向科学界发布。该计划旨在通过允许研究人员评估和改进模型来促进合作和进一步发展。虽然其适用性的全部范围仍有待观察,但最初的发布引发了关于其商业化适应潜力的疑问。

理解治疗学的语言

谷歌首席健康官 Karen DeSalvo 博士详细阐述了 TxGemma 的独特功能。这些模型能够理解标准文本和各种治疗实体的复杂结构。这包括小分子、化学物质和蛋白质,它们是药物开发中的基本组成部分。

这种双重理解使研究人员能够以更直观的方式与 TxGemma 交互。他们可以提出问题,帮助预测潜在新疗法的关键特性。例如,研究人员可以使用 TxGemma 来深入了解候选药物的安全性和有效性,从而加快初步筛选过程。

应对药物开发的挑战

DeSalvo 博士强调了这项创新的背景,指出“从概念到批准使用的治疗药物的开发是一个漫长而昂贵的过程”。通过向更广泛的研究社区提供 TxGemma,谷歌旨在探索新的方法来提高这项复杂工作的效率。

AI:生命科学领域的变革力量

人工智能的出现无疑彻底改变了生命科学行业。它处理海量数据集、识别隐藏模式并生成数据驱动预测的能力开辟了前所未有的机遇。人工智能已经被积极应用于药物开发的各个阶段,包括:

  • 识别药物靶点: 查明参与疾病过程的特定分子或通路。
  • 设计新药: 创建具有所需治疗特性的新型化合物。
  • 重新利用现有疗法: 为已批准用于其他疾病的药物寻找新的用途。

适应人工智能的监管环境

人工智能在药物开发中的快速采用促使监管机构做出回应。今年早些时候,FDA 发布了其首个关于在监管文件中使用人工智能的指南,明确了这项技术应如何纳入提交材料中。同样,在 2024 年,EMA 发布了一份反思文件,概述了其对人工智能在整个药品生命周期中应用的看法。这些发展凸显了人们越来越认识到人工智能在塑造药物研究和监管未来中的作用。

TxGemma 之外:谷歌健康计划一瞥

“The Check Up”活动展示了谷歌一系列其他与健康相关的进展:

谷歌搜索中增强的健康结果

谷歌强调了其搜索引擎在向用户提供可靠和相关健康信息方面的能力改进。这包括改进搜索算法以优先考虑权威来源并以清晰易懂的格式呈现信息。

Health Connect 应用程序中的医疗记录功能

谷歌的 Health Connect 应用程序中引入了一项新功能,使用户能够安全地存储和管理他们的医疗记录。这个集中式平台旨在让个人更好地控制自己的健康数据,并促进与医疗保健提供者的无缝共享。

AI ‘Co-scientist’:虚拟研究伙伴

基于其在 2 月份的公告,谷歌进一步阐述了其 AI ‘co-scientist’ 概念。这个虚拟合作者旨在协助科学家生成新的假设和研究计划。通过利用自然语言处理,AI co-scientist 可以分析研究目标并提出可测试的假设,并附有相关已发表文献的摘要和潜在的实验方法。

例如,如果研究人员的目标是加深对某种致病微生物传播的理解,他们可以用自然语言表达这一目标。然后,AI co-scientist 将回应建议的假设、相关研究论文和可能的实验设计。

Capricorn:用于个性化儿童癌症治疗的 AI

最后,谷歌重点介绍了一个名为 Capricorn 的 AI 工具,该工具利用 Gemini 模型来加速识别儿童癌症的个性化治疗方法。Capricorn 通过将公共医疗数据与去识别化的患者信息相结合来实现这一目标,使医生能够更有效地为个体患者量身定制治疗策略。

深入探讨 TxGemma 的潜在应用

其核心优势在于该模型能够弥合人类可读文本与分子结构复杂且通常难以理解的世界之间的差距。

以下是 TxGemma 的预期用途:

  1. 靶点识别:

    • 研究人员可能会输入:“识别抑制 KRAS 突变癌细胞生长的潜在蛋白质靶点。”
    • TxGemma 利用大量的科学文献和分子数据库,可以建议一系列已知与 KRAS 蛋白相互作用或参与 KRAS 影响的通路的蛋白质。它还可以根据“成药性”(小分子有效结合和调节蛋白质的可能性)等因素对这些靶点进行排序。
  2. 先导化合物发现:

    • 研究人员可以输入:“寻找与蛋白激酶 AKT1 活性位点高亲和力结合的小分子。”
    • TxGemma 可以筛选数十亿个化合物的虚拟库,根据其 3D 结构预测它们与 AKT1 蛋白的结合亲和力。它还可以根据预测的溶解度、渗透性和潜在毒性等特性过滤这些化合物。
  3. 作用机制研究:

    • 研究人员有一种有前景的化合物,但不确定其确切的工作原理。他们可以输入:“预测化合物 XYZ 的作用机制,该化合物在临床前模型中显示出对阿尔茨海默病的活性。”
    • TxGemma 可以分析该化合物的结构,将其与已知药物进行比较,并与基因表达变化和蛋白质-蛋白质相互作用的数据进行交叉参考,以建议该化合物可能影响的潜在途径或靶点。
  4. 药物再利用:

    • 研究人员可能会问:“识别可用于治疗罕见遗传病 ABC 的现有药物。”
    • TxGemma 可以分析疾病 ABC 的遗传和分子基础,然后搜索已知靶向参与该疾病的途径或蛋白质的药物,即使这些药物最初是为完全不同的疾病开发的。
  5. 毒性预测:

    • 在将化合物推进昂贵的临床试验之前,研究人员需要评估其潜在毒性。TxGemma 可用于:“预测化合物 PQR 导致肝损伤或心脏毒性的可能性。”
    • 该模型将分析该化合物的结构并将其与已知有毒化合物的数据库进行比较,从而识别潜在的危险信号。

开源优势:创新的催化剂

通过将 TxGemma 作为开源模型发布,谷歌正在营造一个协作环境,并加快发现的步伐。
潜在影响被放大。
世界各地的研究人员可以为模型的开发做出贡献,改进其算法,扩展其知识库,并根据具体的研究需求对其进行定制。

药物发现的未来

TxGemma 和其他人工智能驱动工具的推出代表着在寻求更高效和有效的药物开发方面迈出了重要一步。虽然人工智能不是灵丹妙药,但它具有巨大的潜力来增强人类专业知识,加快研究时间表,并最终更快地为患者带来拯救生命的疗法。人工智能在生命科学领域的不断发展预示着一个药物发现更加数据驱动、精确且最终更加成功的未来。