一些研究人员对过去50年的科学进步进行了广泛的回顾,并得出了同样令人不安的结论:科学生产力正在下降。曾经更快、更便宜的发现现在需要花费更多的时间、更多的资金和更大的团队才能实现。
尽管人们对这种放缓提出了各种各样的解释,但其中一种解释是,随着研究变得越来越复杂和专业化,科学家必须花费更多时间审阅出版物、设计复杂的实验和分析数据。现在,由慈善基金资助的研究实验室 FutureHouse 正致力于通过一个人工智能平台加速科学研究,该平台旨在实现科学进步道路上许多关键步骤的自动化。该平台由一系列专门用于信息检索、信息合成、化学合成设计和数据分析等任务的人工智能代理组成。FutureHouse 创始人 Sam Rodriques PhD '19 和 Andrew White 相信,通过让每个科学家都能使用他们的AI智能体,他们可以突破科学领域最大的瓶颈,并帮助解决人类面临的一些最紧迫的问题。“自然语言才是真正的科学语言,”罗德里格斯说道。“其他人正在构建生物学的基础模型,其中机器学习模型使用 DNA 或蛋白质的语言,这非常强大。但发现并非用 DNA 或蛋白质来表达。我们所知道的唯一表达发现、假设和推理的方式是使用自然语言。”在麻省理工学院进行博士研究时,罗德里格斯试图在埃德·博伊登教授的实验室中了解大脑的内部运作。“FutureHouse的整个构思都源于我在麻省理工学院攻读博士学位期间的这种感受:即使我们掌握了大脑运作所需的所有信息,我们也无法真正理解,因为没有人有时间阅读所有文献,”罗德里格斯解释道。“即使他们能读完所有文献,也无法将其整合成一个完整的理论。这正是 FutureHouse 的基石。”罗德里格斯在 2019 年的博士论文的最后一章中谈到了对新型大型研究合作的需求。尽管毕业后,他曾在伦敦弗朗西斯克里克研究所管理过一段时间的实验室,但他发现自己被科学领域的广泛问题所吸引,而没有任何一个实验室能够单独解决这些问题。

罗德里格斯说:“我感兴趣的是如何实现科学的自动化或规模化,以及哪些新的组织结构或技术能够提高科学生产力。”当 Chat-GPT 3.5 于 2022 年 11 月发布时,罗德里格斯看到了一条通往更强大模型的道路,这些模型可以自行生成科学见解。大约在那个时候,他还遇到了罗切斯特大学的计算化学家安德鲁·怀特 (Andrew White),后者获得了 Chat-GPT 4 的早期使用权。怀特构建了第一个用于科学的大型语言代理,研究人员们联手创办了 FutureHouse。创始人最初的目标是创建独特的 AI 工具,用于文献检索、数据分析和假设生成等任务。他们从数据收集入手,最终于 2024 年 9 月发布了 PaperQA,Rodriques 称其为全球最优秀的检索和汇总科学文献信息的 AI 代理。大约在同一时间,他们发布了 Has Someone,一款帮助科学家确定是否有人进行过特定实验或探索过特定假设的工具。“我们只是坐在一起问,‘作为科学家,我们一直在问什么样的问题?’”罗德里格斯回忆道。FutureHouse 于今年 5 月 1 日正式推出其平台时,对部分工具进行了品牌重塑。Paper QA 现已更名为 Crow,Has Someone 更名为 Owl。Falcon 是一款能够汇编和审查比 Crow 更多来源的代理。另一个新代理 Phoenix 可以使用专门的工具帮助研究人员规划化学实验。Finch 是一款旨在自动化数据驱动的生物学发现的代理。5 月 20 日,该公司演示了一套多智能体科学发现工作流程,旨在自动化科学流程的关键步骤,并确定了一种新的治疗干性年龄相关性黄斑变性(dAMD)的候选药物。干性年龄相关性黄斑变性是全球范围内导致不可逆失明的主要原因。6 月,FutureHouse 发布了 ether0,这是一个 240 亿字节的开放权重化学推理模型。
“你真的必须把这些代理视为一个更大系统的一部分,”罗德里格斯说。“很快,文献检索代理将与数据分析代理、假设生成代理、实验规划代理整合在一起,它们都将实现无缝协作。”如今,任何人都可以通过 platform.futurehouse.org 访问 FutureHouse 的代理。该公司平台的推出在业界引起了轰动,科学家们开始利用这些代理加速研究的报道层出不穷。FutureHouse 的一位科学家利用这些药物识别出一种可能与多囊卵巢综合征相关的基因,并提出了一种新的治疗该疾病的假设。劳伦斯伯克利国家实验室的另一位研究人员利用 Crow 创建了一个人工智能助手,能够在 PubMed 研究数据库中搜索与阿尔茨海默病相关的信息。另一家研究机构的科学家利用这些药物对帕金森病相关基因进行了系统评价,发现 FutureHouse 的药物表现优于一般药物。罗德里格斯说,那些认为这些代理不像谷歌学术搜索而更像智能助理科学家的科学家可以充分利用该平台。Rodriques 解释道:“寻求推测的人往往会从 Chat-GPT o3 深度研究中获得更多收益,而寻求真正忠实的文献综述的人往往会从我们的代理商那里获得更多收益。”Rodriques 还认为 FutureHouse 很快就会达到这样的程度:其代理可以使用研究论文的原始数据来测试其结果的可重复性并验证结论。从长远来看,为了推动科学进步,罗德里格斯表示,FutureHouse 正在致力于将隐性知识嵌入其代理中,以便能够执行更复杂的分析,同时也让代理能够使用计算工具来探索假设。Rodriques 表示:“科学的基础模型以及蛋白质和 DNA 的语言模型已经取得了诸多进展,我们现在需要让我们的智能体能够访问这些模型以及人们常用的所有其他科学研究工具。构建基础设施,让智能体能够使用更专业的科学研究工具,这一点至关重要。”