
药物研发革命:谷歌的 TxGemma AI 模型
美国国家医学图书馆 (National Library of Medicine) 2022 年的一项研究揭示了一个惊人的统计数据:90% 的候选药物在第一阶段测试结束时失败。这一统计数据凸显了与开发救命疗法相关的固有风险和成本(通常高达数十亿美元)。鉴于这些挑战,谷歌推出了TxGemma,这是一种旨在改变药物开发的开创性 AI 模型。
TxGemma 的演变
TxGemma 是谷歌早期模型 Tx-LLM 的公开继任者,该模型因其在药物开发中的潜在应用而于去年 10 月引起关注。研究人员表示需要一种能够定制的模型来适应他们独特的治疗应用。为此,谷歌已将 TxGemma 提供给开发人员使用,并使其适应特定的数据集。
TxGemma 的功能
该模型基于 Google 的 Gemma 框架构建,但专注于治疗开发。TxGemma 旨在理解和预测治疗在开发生命周期内的特征,帮助研究人员确定最有前景的药物靶点并预测临床试验结果,从而最大限度地减少浪费的时间和资源。
型号规格及性能
TxGemma 提供三种不同大小的模型套件,允许开发人员选择与其硬件功能相匹配的版本。选项包括具有 20 亿、90 亿和 270 亿个参数的模型。每个变体都包含一个“预测”函数,能够执行以下狭义任务:
- 分类(例如,确定分子是否可以穿过血脑屏障)
- 回归(例如,估计药物的结合亲和力)
- 生成(例如,从反应结果中产生潜在反应物)
谷歌强调了其 270 亿参数模型的有效性,并表示:
“最大的 TxGemma 模型(27B 预测版本)性能强劲。它不仅在几乎所有任务上都优于或大致相当于我们之前最先进的通用模型 (Tx-LLM),而且它还可以与许多专门为单一任务设计的模型相媲美或超越它们。具体来说,它在 66 个任务中的 64 个上优于或与我们之前的模型性能相当(在 45 个任务上击败它),并且在 50 个任务上与专门模型的表现相同(在 26 个任务上击败它们)。”
介绍TxGemma-Chat
除了 TxGemma 模型外,谷歌还推出了 90 亿和 270 亿参数配置的 TxGemma-Chat。该版本允许研究人员与模型进行对话,促使模型解释其推理并解决复杂的查询,从而可能大大加速治疗发展。
Agentic-Tx 的推出
谷歌还发布了 Agentic-Tx,它利用了 Gemini 2.0 Pro 框架。这一创新工具解决了利用当前外部信息和进行多步推理相关的挑战。Agentic-Tx 配备了 18 种专用工具,通过以下方式为研究人员提供支持:
- TxGemma 用于高级多步推理
- PubMed、维基百科和网络的常规搜索功能
- 专用分子分析工具
- 基因和蛋白质分析资源
TxGemma 入门
为了充分利用 TxGemma 的功能,感兴趣的开发者可以访问 Vertex AI Model Garden 或 Hugging Face。通过保持这些模型的开源,Google 鼓励研究界进一步创新并分享改进。这种协作方式旨在加快新疗法的开发,最终挽救无数生命。
发表回复 ▼