首页 > 资讯 > 国际 > 正文
2024-04-25 08:20

与你的人工智能实验室合作伙伴“Coscientist”见面:系统成功地规划和实施了现实世界的化学实验

Meet 'Coscientist,' your AI lab partner

在比你阅读这篇文章所需的时间更短的时间内,一个人工智能驱动的系统能够自主学习某些获得诺贝尔奖的化学反应,并设计出一个成功的实验室程序来制造它们。人工智能在几分钟内就完成了所有这些,并且在第一次尝试时就完成了。

卡内基梅隆大学的化学家和化学工程师盖比·戈麦斯(Gabe Gomes)说:“这是第一次由非有机智能来计划、设计和执行这种由人类发明的复杂反应。”他领导的研究团队组装并测试了基于人工智能的系统。他们将他们的发明命名为“共同科学家”。

Coscientist完成的最复杂的反应在有机化学领域被称为钯催化的交叉偶联反应,它的人类发明者因此获得了2010年诺贝尔化学奖,以表彰这些反应在药物开发过程和其他使用精细碳基分子的行业中发挥的巨大作用。

发表在《自然》杂志上的Coscientist展示的能力表明,人类有可能有效地利用人工智能来加快科学发现的步伐和数量,并提高实验结果的可重复性和可靠性。

这个由四人组成的研究小组包括博士生daniel Boiko和Robert MacKnight,他们分别得到了美国家科学基金会西北大学化学酶合成中心和美国国家科学基金会圣母大学计算机辅助合成中心的支持和培训。

“除了他们的系统所展示的化学合成任务之外,Gomes和他的团队还成功地合成了一种超高效的实验室伙伴,”美国国家科学基金会化学部门主任David Berkowitz说。“他们把所有的碎片放在一起,最终的结果远远超过其部分的总和-它可以用于真正有用的科学目的。”






把Coscientist放在一起

Coscientist的软件和硅基部件中最主要的是组成其人工“大脑”的大型语言模型。大型语言模型是一种人工智能,可以从大量数据中提取意义和模式,包括文档中包含的书面文本。

通过一系列的任务,团队测试和比较了多个大型语言模型,包括GPT-4和OpenAI公司制作的其他版本的GPT大型语言模型。

Coscientist还配备了几个不同的软件模块,团队先单独测试,然后联合测试。

“我们试图将科学中所有可能的任务分成小块,然后一点一点地构建更大的图景,”Boiko说,他设计了Coscientist的总体架构和实验任务。“最后,我们把一切都整合到了一起。”

软件模块允许Coscientist做所有研究化学家所做的事情:搜索有关化合物的公开信息,查找和阅读如何控制机器人实验室设备的技术手册,编写计算机代码来进行实验,并分析结果数据以确定哪些有效,哪些无效。

其中一项测试测试了“共同科学家”准确规划化学程序的能力,如果进行化学程序,将产生阿司匹林、对乙酰氨基酚和布洛芬等常用物质。大型语言模型分别进行了测试和比较,包括两个版本的GPT,其中一个软件模块允许它像人类化学家一样使用谷歌在互联网上搜索信息。

然后检查最终的程序,并根据它们是否会导致所需的物质,步骤的详细程度和其他因素进行评分。一些最高分是由具有搜索功能的GPT-4模块获得的,这是唯一一个为合成布洛芬创造了可接受质量的程序的模块。

Boiko和MacKnight观察到Coscientist正在展示“化学推理”,Boiko将其描述为使用化学相关信息和先前获得的知识来指导一个人的行为的能力。它使用以简化分子输入行输入系统(SMILES)格式编码的公开可用的化学信息——一种机器可读的表示分子化学结构的符号——并根据在SMILES数据中仔细检查的分子的特定部分对其实验计划进行更改。

“这是化学推理的最佳版本,”博伊科说。

进一步的测试纳入了软件模块,允许Coscientist搜索和使用描述控制机器人实验室设备的应用程序编程接口的技术文档。这些测试对于确定Coscientist是否可以将其合成化合物的理论计划转化为计算机代码,从而指导物理世界中的实验室机器人非常重要。

引进机器人

高科技机器人化学设备通常用于实验室,对微小的液体样品进行一次又一次的精确吸、喷、加热、摇和其他操作。这种机器人通常是由人类化学家编写的计算机代码控制的,他们可能在同一个实验室,也可能在美国的另一边。

这是此类机器人首次由人工智能编写的计算机代码控制。

Coscientist团队从一些简单的任务开始,要求它制造一个液体处理机器人,将有色液体分配到一个装有96个排列成网格的小孔的盘子里。它被要求“用你选择的一种颜色涂上每一条线”,“画一条蓝色对角线”以及其他让人想起幼儿园的任务。

从液体处理101毕业后,该团队向Coscientist介绍了更多类型的机器人设备。他们与翡翠云实验室(Emerald Cloud Lab)合作,后者是一家商业机构,配备了各种自动化仪器,包括分光光度计,用于测量化学样品吸收的光的波长。然后,Coscientist被出示一个装有三种不同颜色(红、黄、蓝)液体的盘子,并被要求确定盘子里有什么颜色以及它们在盘子里的位置。

由于Coscientist没有眼睛,它编写了代码,机器人将神秘色板传递给分光光度计,并分析每个孔吸收的光的波长,从而确定哪些颜色存在以及它们在板上的位置。为了完成这项任务,研究人员必须在正确的方向上给Coscientist一点提示,指导它思考不同颜色是如何吸收光的。剩下的就交给人工智能了。

Coscientist的期末考试是将组装的模块和训练组合在一起,以完成团队的命令,“进行铃木和Sonogashira反应”,以他们的发明者铃木明(Akira Suzuki)和Sonogashira Kenkichi Sonogashira命名。

该反应发现于20世纪70年代,利用金属钯催化有机分子中碳原子之间的键。事实证明,这些反应在生产治疗炎症、哮喘和其他疾病的新型药物方面非常有用。它们也被用于许多智能手机和显示器中oled的有机半导体。这些突破性的反应及其广泛的影响在2010年获得了诺贝尔奖,并被正式授予了须子、理查德·赫克和根岸英一。

当然,Coscientist之前从未尝试过这些反应。所以,正如作者写前一段所做的那样,它去维基百科上查了一下。

权力越大,责任越大

“对我来说,‘尤里卡’的时刻是看到它提出了所有正确的问题,”麦克奈特说,他设计了允许Coscientist搜索技术文档的软件模块。

Coscientist主要在维基百科上寻找答案,同时还有许多其他网站,包括美国化学学会、英国皇家化学学会的网站,以及其他包含描述铃木和Sonogashira反应的学术论文的网站。

在不到四分钟的时间里,Coscientist设计了一个精确的程序,使用团队提供的化学物质产生所需的反应。当它试图用机器人在物理世界中执行其程序时,它在编写的代码中犯了一个错误,该代码用于控制加热和摇动液体样品的设备。在没有人为提示的情况下,Coscientist发现了问题,查阅了设备的技术手册,修改了代码,然后再次尝试。

结果包含在一些微小的透明液体样本中。Boiko分析了样品,发现了铃木反应和Sonogashira反应的光谱特征。

当博伊科和麦克奈特告诉戈麦斯Coscientist是做什么的时候,他表示不相信。“我以为他们是在跟我开玩笑,”他回忆道。但事实并非如此。他们绝对不是。就在那时,我突然意识到,好吧,我们有了一个非常新、非常强大的东西。”

有了这种潜在的力量,就需要明智地使用它,防止滥用。戈麦斯说,了解人工智能的能力和局限性是制定明智的规则和政策的第一步,这些规则和政策可以有效地防止人工智能的有害使用,无论是有意的还是偶然的。

他说:“我们需要对如何部署这些技术负责和深思熟虑。”

戈麦斯是为美国政府确保人工智能安全使用的努力提供专家建议和指导的几位研究人员之一,例如拜登政府2023年10月关于人工智能发展的行政命令。

加速发现,使科学民主化

自然界的大小和复杂性几乎是无限的,它包含着无数的发现,等待着我们去发现。想象一下,新的超导材料可以显著提高能源效率,或者可以治愈无法治愈的疾病并延长人类寿命的化合物。然而,获得取得这些突破所需的教育和培训是一段漫长而艰辛的旅程。成为一名科学家很难。

戈麦斯和他的团队设想,像Coscientist这样的人工智能辅助系统,可以作为一种解决方案,弥合未被探索的广阔大自然与训练有素的科学家供不应求的现实之间的差距。

人类科学家也有人类的需求,比如睡觉和偶尔走出实验室。而人类引导的人工智能可以昼夜不停地“思考”,有条不紊地翻看每一块石头,反复检查实验结果的可重复性。戈麦斯说:“我们可以让一些东西自主运行,试图发现新现象、新反应、新想法。”

他说:“你还可以大大降低任何领域的进入门槛。”例如,如果一个未受过铃木反应训练的生物学家想以一种新的方式探索铃木反应的用途,他们可以要求Coscientist帮助他们计划实验。

“你可以实现资源和理解的大规模民主化,”他解释说。

戈麦斯表示,在科学领域,尝试、失败、学习和改进是一个反复的过程,人工智能可以大大加速这一过程。“这本身将是一个巨大的变化。”