AI个人学习
和实操指南
资源推荐1

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手

在浩瀚的科研领域,科学家们如同探险家,凭借着过人的才智与创造力,结合从浩如烟海的文献中汲取的深刻见解和专业知识,不断开辟着新颖且可行的研究方向,引领着后续的探索之路。然而,在诸多学科中,科研人员常常面临 "广度" 与 "深度" 的双重挑战。科学出版物数量的爆炸式增长,以及整合来自陌生领域的知识洞见的需求,都使得科研工作变得愈发复杂。跨学科研究往往能催生颠覆性的突破,例如,CRISPR 技术的诞生,正得益于微生物学、遗传学和分子生物学等多学科知识的融合,Emmanuelle Charpentier 和 Jennifer Doudna 也因在 CRISPR 领域的开创性工作荣获 2020 年诺贝尔化学奖。

正是在现代科学发现过程中存在着诸多未被满足的需求的驱动下,并受益于近期人工智能技术的飞速发展,特别是 AI 在整合复杂学科知识以及执行长期规划与推理方面展现出的卓越能力,一个名为 AI 协同科学家的系统应运而生。AI 协同科学家是一款多 Agent (智能体) AI 系统,旨在成为科研人员的虚拟合作助手。它构建于 Gemini 2.0 之上,其设计理念与科学研究方法的推理过程高度契合。与传统的文献回顾、摘要和深度研究工具不同,AI 协同科学家致力于挖掘原创性的新知识,并根据已有的证据,结合特定的研究目标,制定具有创新性的研究假设和方案。


 

AI 协同科学家:赋能科研,加速发现

科研人员只需以自然语言设定研究目标,AI 协同科学家就能自动生成新颖的研究假设、详细的研究概述和实验方案。为了实现这一目标,该系统采用了一系列专业化 Agent(智能体),包括 "生成 (Generation)"、"反思 (Reflection)"、"排序 (Ranking)"、"进化 (Evolution)"、"邻近 (Proximity)" 和 "元评审 (Meta-review)" 等,这些 Agent 的设计灵感均来源于科学研究方法本身。这些 Agent 利用自动化反馈进行迭代,不断生成、评估和优化假设,形成一个自我完善的循环,产出质量和创新性日益提升的研究成果。

AI 协同科学家概览。

AI 协同科学家专为协作而生,科研人员可以通过多种方式与系统互动,包括直接提供自己的初步想法以供系统深入探索,或者以自然语言对系统生成的输出结果进行反馈。此外,AI 协同科学家还整合了网络搜索和专业 AI 模型等工具,以增强假设的可靠性和质量。

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手-1

AI 协同科学家多 Agent 系统组件示意图,以及系统与科研人员之间的交互模式。

AI 协同科学家会将科研人员设定的目标解析为研究计划,并由 "主管 (Supervisor)" Agent 进行管理。"主管" Agent 负责将专业化 Agent 分配到工作队列并分配资源。这种设计使得系统能够灵活扩展计算能力,并根据特定的研究目标迭代优化其科学推理能力。

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手-2

AI 协同科学家系统概览。专业化 Agent (红色方框,具有独特角色和逻辑);科研人员输入和反馈 (蓝色方框);系统信息流 (深灰色箭头);Agent 间反馈 (Agent 部分内的红色箭头)。

 

算力扩展:驱动更深度的科学推理

AI 协同科学家利用算力扩展技术,实现迭代推理、演进和优化输出结果。关键的推理步骤包括:基于 "自我博弈 (self-play)" 的科学辩论,用于生成新颖的假设;排序竞赛,用于假设比较;以及 "进化 (evolution)" 过程,用于质量提升。系统的 Agent 特性促进了递归式的自我批判,包括利用工具进行反馈以改进假设和方案。

系统的自我提升依赖于从竞赛中获得的 "Elo" 自动评估指标。由于 Elo 指标的核心作用,研究团队评估了较高的 Elo 评分是否与较高的输出质量相关。通过分析 Elo 自动评分与 GPQA 基准测试 (针对钻石级难题) 的准确性之间的一致性,研究团队发现,较高的 Elo 评分与更高的正确答案概率呈正相关。

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手-3

AI 协同科学家 (蓝色线) 和 Gemini 2.0 参考模型 (红色线) 在 GPQA 钻石级难题上的平均准确率,按 Elo 评分分组。Elo 评分是一种自动评估指标,并非基于独立的标准答案。

七位领域专家精心挑选了各自专业领域的 15 个开放性研究目标和最佳猜测解决方案。使用自动化 Elo 指标,研究团队观察到,在这些复杂问题上,AI 协同科学家的表现优于其他先进的 Agent 模型和推理模型。分析结果重现了利用源于科学研究方法的归纳偏见来扩展测试时计算的优势。实验结果表明,随着系统推理和改进时间的增加,自我评估的质量也随之提高,甚至超越了其他模型和未经辅助的人类专家。

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手-4

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手-5

AI 协同科学家的性能随着系统计算时间的增加而提升。这可以从自动化 Elo 指标逐渐超越其他基线模型中看出。上图: 最佳评分假设的 Elo 进展。下图: 前 10 个假设的平均 Elo 进展。

在 11 个研究目标的小型子集上,专家评估了 AI 协同科学家生成结果的新颖性和潜在影响,并与其他基线模型进行了比较;他们还提供了总体偏好。尽管样本量较小,专家们仍然认为 AI 协同科学家具有更高的新颖性和潜在影响力,并且更倾向于其输出结果。此外,人类专家的偏好似乎也与之前介绍的 Elo 自动评估指标相吻合。

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手-6

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手-7

人类专家评估认为,AI 协同科学家的研究成果具有更高的新颖性和潜在影响 (左图),并且相比其他模型更受青睐 (右图)。

 

实验验证:AI 协同科学家的假设在现实世界中的应用

为了评估系统新颖预测的实际应用价值,研究团队在三个关键生物医学领域进行了端到端实验室实验,验证 AI 协同科学家生成的假设和研究方案。这三个领域分别是:药物再利用、新型治疗靶点发现以及抗菌素耐药性机制解析。这些实验均在专家指导下进行,并涵盖了各种复杂程度的应用场景:

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手-8

白血病:药物再利用的新突破

药物研发是一个日益耗时且成本高昂的过程。对于每一种新的适应症或疾病,新疗法的研发都需要重新启动发现和开发过程的许多环节。"药物再利用" 正是为了应对这一挑战而生,它旨在发现现有药物超出其原定用途的新治疗应用。然而,由于任务的复杂性,药物再利用需要广泛的跨学科专业知识。

研究团队应用 AI 协同科学家辅助预测药物再利用的机会,并与合作伙伴一起,通过计算生物学、临床专家反馈和体外实验验证了这些预测。

值得注意的是,AI 协同科学家针对急性髓系白血病 (AML) 提出了新颖的药物再利用候选方案。随后的实验验证了这些方案,证实所推荐的药物在多种 AML 细胞系中,均能在临床相关浓度下抑制肿瘤细胞的活力。

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手-9

AI 协同科学家预测的三种新型 AML 药物再利用方案之一的剂量反应曲线。KIRA6 在临床相关浓度下抑制 KG-1 (AML 细胞系) 的活力。能够在较低药物浓度下降低癌细胞活力具有多重优势,例如,可以降低脱靶副作用的风险。

肝纤维化:加速靶点发现

与药物再利用相比,识别新型治疗靶点更为复杂,且常常导致低效的假设选择和体外与体内实验的优先级排序不佳。AI 辅助的靶点发现有助于简化实验验证流程,并有可能降低开发时间和成本。

研究团队深入探索了 AI 协同科学家系统在靶点发现假设方面的能力,包括提出、排序和生成假设及实验方案,研究重点是肝纤维化。AI 协同科学家展现出了其潜力,识别出了基于临床前证据的表观遗传学靶点,这些靶点在人类肝脏类器官(3D 细胞培养模型,旨在模拟人类肝脏的结构和功能)中显示出显著的抗纤维化活性。这些研究发现将在斯坦福大学合作者即将发布的一份报告中详细阐述。

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手-10

AI 协同科学家提出的肝纤维化靶点治疗方案与纤维化诱导剂 (阴性对照) 和抑制剂 (阳性对照) 的比较。AI 协同科学家提出的所有治疗方案均显示出良好的活性 (所有建议药物的 p 值均 <0.01),包括可能逆转疾病表型的候选药物。详细结果将在斯坦福大学合作者即将发布的报告中阐述。

抗菌素耐药性:机制解析

作为第三个验证案例,研究团队专注于生成假设,以解释与抗菌素耐药性 (AMR) 相关的细菌基因转移进化机制。抗菌素耐药性是指微生物进化出的抵抗抗感染药物的机制。这又是一个复杂的挑战,需要理解基因转移的分子机制(包括结合、转导和转化)以及驱动 AMR 基因传播的生态和进化压力。

  • 结合 (conjugation): 细菌之间通过直接接触或细胞间桥,传递遗传物质的过程。
  • 转导 (transduction): 通过病毒(噬菌体)将 DNA 从一个细菌细胞转移到另一个细菌细胞的过程。
  • 转化 (transformation): 细菌直接从周围环境中吸收游离 DNA 并整合到自身基因组中的过程。

为了进行这项测试,专家研究人员指示 AI 协同科学家探索一个他们团队已经取得新发现但尚未公开的主题,即解释 "衣壳形成噬菌体诱导染色体岛 (cf-PICIs)" 如何在多种细菌物种中存在。cf-PICIs 是一类特殊的基因元件,能够在细菌之间转移,并与噬菌体 (一种感染细菌的病毒) 产生复杂的相互作用。令人惊讶的是,AI 协同科学家系统独立提出了 cf-PICIs 与多种噬菌体尾部相互作用以扩展其宿主范围的假设。这一 "in silico"(计算机模拟)发现,在 AI 协同科学家系统应用之前,已经在原始的新型实验室实验中得到了验证,相关成果在与弗莱明倡议和伦敦帝国理工学院的合作者共同撰写的同步发表的论文 (12) 中进行了描述。这充分体现了 AI 协同科学家系统作为辅助技术的价值,因为它能够有效利用数十年来关于该主题的所有开放获取文献的研究成果。

谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手-11

AI 协同科学家重新发现新型基因转移机制的时间线。蓝色: cf-PICI 移动性发现的实验研究流程时间线。红色: AI 协同科学家开发和概括这些关键发现 (在没有先验知识的情况下)。

 

局限与展望:持续进步的阶梯

在相关研究报告中,研究团队详细阐述了系统的若干局限性以及改进方向,包括:加强文献回顾、事实核查、与外部工具的交叉验证、自动评估技术,以及更大规模的评估,例如邀请更多具有不同研究主题的领域专家参与。AI 协同科学家的问世,代表着人工智能辅助科研技术迈出了意义非凡的一步,有望显著加速科学发现的进程。该系统能够跨越多个科学和生物医学领域,生成新颖且可验证的假设(其中一些已在实验中得到验证),并且具备通过增强算力实现递归式自我提升的能力。这些特性共同展现了其在加速科研人员应对科学和医学领域重大挑战方面的巨大潜力。人们期待以负责任的态度,进一步探索 AI 协同科学家作为科研辅助工具的潜力。该项目生动地展现了协作式和以人为中心的人工智能系统如何增强人类的创造力并加速科学发现。

AI 协同科学家 "Trusted Tester Program" 启动,邀您共同探索科研新范式

研究团队对 AI 协同科学家系统展现出的初步成果感到振奋,并认为有必要在更广泛的科学和生物医学领域评估其优势和局限性。为了负责任地推进这项工作,研究团队将通过 "Trusted Tester Program" 向研究机构开放系统访问权限。全球感兴趣的研究机构均可考虑加入该计划,详情请见 链接

工具下载
未经允许不得转载:首席AI分享圈 » 谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文