从实验到假设:AI Co-Scientist 如何重现分子微生物学机制
通过大语言模型和多智能体推理,AI Co-Scientist成功重现cf-PICIs的跨物种机制,凸显AI在分子微生物学中辅助假说生成与研究设计的潜力。
两篇近期发表在 Cell 的研究提供了关于分子微生物学科学发现及人工智能新兴角色的互补视角。第一项研究(He et al., 2025)通过实验表征了一类新型噬菌体诱导染色体岛(cf-PICIs),其可以自组装衣壳,并劫持多种噬菌体的尾部,在不同细菌属间扩散。伴随研究(Penadés et al., 2025)使用基于大语言模型的 AI co-scientist 平台生成 cf-PICI 跨物种转移机制的假说。值得注意的是,AI co-scientist 的最高评分假说——cf-PICIs 通过劫持具有广泛宿主范围的噬菌体尾部实现跨物种传播——与实验验证结果高度一致,展示了 LLM 在补充实验科学中的潜力。
AI co-scientist:架构与方法
AI co-scientist(Gottweis et al., 2025)是基于 Gemini 2.0 的多智能体系统,旨在模拟并加速科学方法。关键特性包括:
- 多智能体假说生成:不同智能体负责生成、审查和优化候选假说。
- 迭代式锦标赛推理:假说在基于 Elo 分数的框架中竞争,实现递归自我改进。
- 专家参与工作流:科研人员设定研究目标和约束,提供领域指导,同时让 AI 从机制上推理。
- 可扩展的测试计算:长时间计算(可达数天)允许比传统 LLM 更复杂的推理。
该系统在三个生物医学领域进行了验证:药物再利用、新靶点发现及细菌进化,成功提出经实验支持的预测,包括独立识别 cf-PICI 中的新型基因转移机制。
cf-PICI 生物学应用
在 Cell 研究(Penadés et al., 2025)中,AI co-scientist 接收到最小化的整理文档(Data S1),仅包含七种细菌物种中 cf-PICIs 的已发表信息。AI 生成了五条假说并进行了排名:
- 衣壳-尾部相互作用:cf-PICIs 劫持不同辅助噬菌体尾部进入多种细菌。
- 整合机制:替代整合路径可能促进宿主范围扩展。
- 进入机制:直接与细菌膜或囊泡相互作用。
- 辅助噬菌体与环境因素:广义转导或生态应激的作用。
- 其他转移机制:接合、胞外囊泡及稳定策略。
最高评分的假说准确重现实验发现:cf-PICIs 利用多种物种特异性噬菌体尾部实现跨物种转移。这凸显了 LLM 驱动的推理在补充实验专业知识中的能力。
与其他 LLM 的对比分析
研究还使用相同最小输入(Data S1)测试了多种其他 LLM,包括 OpenAI o1、Gemini 2.0 Pro/Flash Thinking、OpenAI Deep Research、OpenAI o3-mini-high、Claude Sonnet 3.7 和 Deepseek-R1。
| LLM / 系统 | 是否复现正确机制? | 核心假说 | 备注 |
|---|---|---|---|
| AI co-scientist | ✅ | 衣壳-尾部相互作用、整合、进入、转移 | 迭代 Elo 锦标赛成功得出正确机制假说 |
| OpenAI o1 | ❌ | 广泛尾部兼容 | 推理错误:假设不同物种使用相同尾部,失败 |
| Gemini 2.0 Pro & Flash | ❌ | 无尾受体相互作用、整合 | 部分合理,但忽略物种特异性尾部关键作用 |
| OpenAI Deep Research | ❌ | 噬菌体“桥”跨物种转移 | 对部分 PICIs 有概念性合理性,但不适用于 cf-PICIs;过度依赖广义转导 |
| o3-mini-high | ❌ | 自主衣壳组装、尾部多用 | 错误归因跨物种扩散于尾部保守性 |
| Claude Sonnet 3.7 | ❌ | 多噬菌体家族尾部 | 模糊且生物学不准确;错误依赖多个噬菌体家族 |
| Deepseek-R1 | ❌ | 广宿主尾、接头蛋白、广义转导 | 机制错误;错误表述 PICI 生物学 |
解释:仅 AI co-scientist 提出了实验验证的机制,强调了迭代推理、自我改进及多智能体辩论在生成生物学准确假说中的重要性。
对 AI 增强生物学的启示
这些发现表明:
- LLM 可以作为假说加速器,提出机制上合理且可测试的研究方向。
- 迭代自我改进框架(如 Elo 锦标赛)提升假说排序精度。
- 跨模型比较仍然必要,创意输出不等于生物学正确。
- 最小化整理输入结合人类专业知识,可让 LLM 补充但不能取代科学推理。
限制与注意事项
- 领域依赖:目前验证仅针对 cf-PICIs,其他领域需进一步研究。
- 计算与时间要求:迭代锦标赛推理计算密集。
- 验证瓶颈:假说需实验验证,AI 无法替代湿实验。
- 可解释性:多智能体与锦标赛推理提升假说质量,但降低单步透明度。
OpenAI 与 Retro Biosciences:LLM 在分子设计中的应用
除了假说生成,LLM 正在重塑分子工程。OpenAI 与 Retro Biosciences 利用基于 GPT-4b 的模型设计合成转录因子,以增强细胞重编程,用于再生医学和长寿研究(Sinodrugwatch, 2025)。这标志着从分析推理向可操作分子设计的转变,呼应 AI co-scientist 提出可实验验证假说的能力。整体来看,LLM 正逐步成为科研中的主动协作伙伴。
结论
cf-PICI 研究表明,LLM 不仅能生成机制性、可测试的假说,在特定配置下甚至能重现未发表的实验结果。多智能体、迭代推理架构结合专家参与工作流是保证机制正确性的关键。缺乏这些特性的 LLM 容易出现错误,而结构良好的 AI 系统可作为协作科研伙伴,加速发现并揭示此前被忽视的机制。负责任的整合仍需验证、可解释性和人类监督,但 AI 驱动的假说导向研究潜力空前。
参考文献
- Gottweis, J.; Weng, W.-H.; Daryin, A.; et al. Towards an AI Co-Scientist. arXiv 2025, 2502.18864.
- He, J.; Costa, T. R. D.; et al. Experimental Characterization of cf-PICIs Reveals Phage Tail Hijacking Enables Cross-Species Transfer. Cell 2025, S0092-8674(25)00974-2.
- Penadés, J. R.; Costa, T. R. D.; et al. AI Co-Scientist Predicts Mechanism of cf-PICI Host Range Expansion via Phage Tail Hijacking. Cell 2025, S0092-8674(25)00973-0.
- OpenAI & Retro Biosciences. AI-Driven Protein Engineering: Designing Next-Generation Synthetic Transcription Factors. SinoDrugWatch, 2025.
声明:本综述仅用于信息和教育目的,概述已发表研究,不构成医疗、法律或专业建议。任何科研应用均应以实验验证和专业判断为准。