你有没有想过,可能就在你阅读这篇文章的几分钟内,获得诺贝尔奖的化学反应就能被完美复刻出来。
是的,你没有听错,现在由AI驱动的系统已经能够自主了解这些化学反应,甚至设计出了实验室程序来制造它们。
人工智能在短短几分钟内就完成了这一切,并且一次尝试就成功了。“这是第一次非有机智能计划、设计和执行人类发明的复杂反应。”卡内基梅隆大学化学家兼化学工程师Gabe Gomes表示,他领导了组装和测试基于AI的系统的研究团队。
而Coscientist实现的复杂反应在有机化学中被称为钯催化交叉偶联,该反应为美国化学家Richard Fred Heck与两位日本化学家Ei-ichi Negishi和Akira Suzuki赢得了2010年诺贝尔奖化学奖,用以表彰他们发现这些反应在药物开发过程和其他使用挑剔的碳基分子的行业中发挥的巨大作用。
Coscientist所展示的能力表明,人类有潜力有效地利用人工智能来提高计算速度和数量科学发现,并提高实验结果的可重复性和可靠性。
Coscientist的软件和硅基部件中最主要的是构成其人工“大脑”的大型语言模型。为此团队测试并比较了多个大语言模型,包括GPT-4以及GPT其他版本。
Coscientist配备了几个不同的软件模块,团队首先对这些模块进行单独测试,接着进行协同测试。
“我们试图将科学中所有可能的任务分成小部分,然后逐个构建更大的图景,”参与研究的博士生Daniil Boiko说道,他设计了Coscientist的总体架构及其实验任务,“最后,我们把一切整合到了一起”。
借助软件模块,Coscientist能够实现所有研究化学家都会做的事情:搜索有关化合物的公共信息,查找并阅读有关技术手册怎么来控制机器人实验室设备,编写计算机代码来进行实验,并分析结果数据以确定哪些有效、哪些无效。
团队还测试检验了Coscientist准确规划化学程序的能力。如果执行该程序,将产生阿司匹林、对乙酰氨基酚和布洛芬等常用物质。大型语言模型经过单独测试和比较,然后对最终的程序进行全方位检查并根据它们是否会产生所需的物质、步骤的详细程度以及其他因素进行评分。
最高分是由支持搜索的GPT-4模块获得,该模块是唯一一个创建了可接受质量的布洛芬合成程序的模块。
Boiko和同事Robert MacKnight观察了Coscientist演示“化学推理”的过程。Boiko将其描述为使用化学相关信息和先前获得的知识来指导自己行动的能力。它使用以简化分子输入线输入系统(SMILES)格式(一种代表分子化学结构的机器可读符号)编码的公开化学信息,并根据分子的特定部分对其实验计划进行了更改仔细检查SMILES数据。
进一步的测试纳入了软件模块,允许Coscientist搜索和使用描述控制机器人实验室设备的应用程序编程接口的技术文档。这些测试对于确定Coscientist能否将其合成化合物的理论计划转化为指导物理世界中的实验室机器人的计算机代码非常重要。
高科技机器人化学设备通常在实验室中使用,以精确的精度一遍又一遍地吸取、喷射、加热、摇动微小的液体样品以及执行其他操作。此类机器人通常通过人类化学家编写的计算机代码进行控制。
该团队以简单的任务启动Coscientist,要求其使用机器人液体处理机将有色液体分配到包含96个网格排列的小孔的板中,执行命令包括“用你选择的一种颜色为每条线着色”,“画一条蓝色对角线”等。
然后向科学家展示一个含有三种不一样的颜色(红色、黄色和蓝色)液体的盘子,并要求其确定存在哪些颜色以及它们在盘子上的位置。
由于Coscientist没有眼睛,编写代码自动将神秘色板传递到分光光度计,并分析每个孔吸收的光的波长,从而识别存在哪些颜色及其在色板上的位置。对于这项任务,研究人员一定在正确的方向上稍微推动Coscientist,指示它思考不一样的颜色如何吸收光线。
Coscientist的期末考试是将其组装的模块和训练放在一起,以完成“Suzuki和Sonogashira反应”。
该反应发现于20世纪70年代,利用金属钯催化有机分子中碳原子之间的键。事实上,这些反应对于生产治疗炎症、哮喘和其他疾病的新型药物很有用。它们还用于许多智能手机和显示器中OLED的有机半导体。2010 年,Sukuzi、Richard Heck和Ei-ichi Negishi联合获得诺贝尔奖,正式认可了这些突破性反应及其广泛影响。
当然,Coscientist以前从未尝试过这些反应。因此,它在网上查找了相关知识,包括、美国化学会、英国皇家化学会和其他包含描述该反应的学术论文网站。
在不到四分钟的时间里,Coscientist设计了一个精确的程序,使用团队提供的化学品产生所需的反应。不过当它试图用机器人在现实世界中执行程序时,它在为控制加热和摇动液体样本的设备而编写的代码中犯了一个错误。
但是,即使没有人类提示,Coscientist自己就发现了问题,查阅了设备的技术手册,更正了代码并再次尝试。
结果包含在一些透明液体的微小样本中。Boiko分析了样品,发现了反应的光谱特征。
当Boiko和MacKnight描述出Coscientist的所作所为时,Gomes表示难以置信。“我以为他们在开玩笑”,“那时我们突然意识到,我们这里有一些非常新、很强大的东西”。
有了这种潜在的力量,就需要明智地使用它并防止滥用。Gomes表示,了解人工智能的能力和局限性是制定明智的规则和政策的第一步,这些规则和政策可以有很大效果预防人工智能的有害使用,无论是有意还是无意。
自然世界的规模和复杂性其实就是无限的,其中蕴藏着无数的发现等待着我们去发现。想象一下新的超导材料可以明显提高能源效率,或者可以治愈其他无法治疗的疾病并延长人类寿命的化合物。然而,获得实现这些突破所需的教育和培训是一个漫长而艰巨的旅程。
Gomes和团队设想像Coscientist这样的人工智能辅助系统作为一种解决方案,可以弥合未经探索的浩瀚自然与训练有素的科学家短缺(而且可能永远如此)之间的差距。
人类科学家也有人类的需求,比如睡觉和偶尔走出实验室。而人类引导的AI可以“思考”。夜以继日,有条不紊地翻阅每一块众所周知的石头,检查并重新检查其实验结果的可复制性。
“我们能拥有可以自主运行的东西,尝试发现新现象、新反应、新想法。”Gomes说。
“你还可以明显降低基本上任何领域的进入门槛。”他说。例如,如果未受过相关培训的生物学家想要以新的方式探索其用途,他们能够要求Coscientist帮他们计划实验。
Gomes表示,科学中有一个尝试、失败、学习和改进的迭代过程,AI可以大大加速这样的一个过程。“这本身就将是一个巨大的变化”。
原标题:《不到4分钟,这个GPT驱动的“化学家”能制造药物,还能复现诺奖研究!研究登Nature》