人工智能预测化学物质对人类的气味

一种新的计算机模型“绘制”气味分子的“地图”,以区分肉味、粉末味、甜味和许多其他气味

Black man with closed eyes smelling blooming lupine flowers

研究人员长期以来都知道,我们吸入的分子的化学结构会影响我们闻到的气味。但在大多数情况下,没有人能确切地弄清楚这是如何发生的。科学家们已经破译了一些特定的规则,这些规则支配着鼻子和大脑如何根据空气传播分子的特征来感知它。现在已经很清楚,例如,我们会迅速将某些含硫化合物识别为大蒜的气味,并将某些氨衍生的胺识别为鱼腥味。但这只是例外。

事实证明,结构上不相关的分子可能具有相似的气味。例如,氰化氢和较大的环状苯甲醛都闻起来像杏仁。同时,微小的结构变化——即使是移动一个双键的位置——也会极大地改变气味。

为了理解这种令人困惑的化学现象,研究人员求助于人工智能的计算能力。现在,一个团队训练了一种称为图神经网络的人工智能,根据气味分子的化学特征,预测化合物闻起来像什么——玫瑰、药用、泥土等等。研究人员在一篇新的预印本论文草稿中报告说,该计算机模型对新气味的评估与人类一样可靠,该论文已发布在预印本存储库bioRxiv上。


支持科学新闻报道

如果您喜欢这篇文章,请考虑支持我们屡获殊荣的新闻报道,方式是 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的有影响力的故事的未来。


“它实际上已经学到了一些关于世界气味以及气味如何运作的根本性知识,这让我感到震惊,”Alex Wiltschko说道,他现在在谷歌的风险投资公司GV工作,他在谷歌研究院时领导了数字嗅觉团队。

人类的平均鼻子包含约350种嗅觉受体,这些受体可以与潜在的大量空气传播分子结合。然后,这些受体启动神经元信号,大脑随后将这些信号解释为咖啡、汽油或香水的味道。尽管科学家们从广义上了解这个过程是如何运作的,但许多细节——例如嗅觉受体的精确形状或系统如何编码这些复杂信号——仍然让他们难以捉摸。

各种已知气味的“嗅觉参考工具包”。 来源:Joel Mainland

哥伦比亚大学的嗅觉神经科学家斯图尔特·费尔斯坦将该模型称为“计算生物学的杰作”。但是,正如许多基于机器学习的研究的典型情况一样,“在我看来,它永远不会让你对事物如何运作有更深刻的理解,”费尔斯坦说,他没有参与这篇论文。他的批评源于该技术固有的一个特征:这种神经网络通常是不可解释的,这意味着人类研究人员无法获得模型用来解决问题的推理过程。

更重要的是,该模型跳过了神经系统难以理解的运作方式,而是在分子和气味之间建立直接联系。即便如此,费尔斯坦和其他人仍将其描述为一种潜在有用的工具,可用于研究嗅觉及其与化学的复杂关系。对于参与研究的研究人员来说,该模型也代表着朝着更精确、基于数字的方式来描述气味宇宙迈进了一步,他们希望这最终能将这种感觉带入数字世界。

“我深信未来计算机可以像看到和听到一样闻到气味,”Wiltschko说,他现在正在探索这项技术的商业化。

长期以来,研究人员一直在使用计算建模来研究嗅觉。在2017年发表的一篇论文中,一项众包竞赛产生了一个模型,该模型能够将分子结构与一些标签匹配——包括“甜”、“焦”和“花香”——这些标签从人类体验的角度描述了它们的气味。在新的后续工作中,Wiltschko的团队使用来自约5,000个经过充分研究的分子(包括其原子的特征以及原子之间的键)的数据训练了其模型。结果,该模型生成了一个极其复杂的“气味地图”。与传统的纸质地图(在二维空间中绘制位置)不同,该模型根据256个维度(算法确定可用于区分分子的属性)将气味分子放置在“位置”上。

气味地图的示意图。 来源:Alexander B. Wiltschko

为了查看这张地图是否符合实际的人类感知,Wiltschko的团队求助于莫奈尔化学感官中心的嗅觉神经科学家Joel Mainland。“在这里定义成功有点难,因为‘你如何定义某物的气味?’”Mainland说。“[香水]行业所做的——以及我们在这里所做的——基本上是你召集一组人,让他们描述它的气味。”

首先,Mainland和其他人确定了一组气味尚未被记录的分子的集合。至少有15名受过训练的研究参与者嗅了每种分子。由于对气味的感知可能因人而异,这要归功于基因差异、个人经验和偏好,研究人员对参与者的评估进行了平均,并将该平均值与模型的预测进行了比较。他们发现,对于53%的分子,该模型比典型的个人小组参与者更接近小组的平均值——他们说这种表现超过了早期的基于标签的模型。

虽然新模型可能证明能够模拟人类对单一分子的气味感知,但它在现实世界中表现不佳。从玫瑰到香烟烟雾,大多数气味都是混合物。此外,该团队使用香水数据训练了新模型,这些数据偏向于令人愉悦的气味,而远离令人厌恶的气味。

即使存在这些局限性,该模型仍然可以帮助那些对气味化学感兴趣的人,例如,指导想要识别未被充分研究的难闻气味或测试分子结构调整如何改变感知的研究人员。香水化学家可以在改进香水配方或识别潜在的新成分时参考它。

Wiltschko的团队已经使用该模型来测试关于化学物质结构与其气味如何被人和其他生物感知之间联系的理论。在8月份发布在bioRxiv上的另一篇预印本论文中,研究人员认为,动物的新陈代谢——维持其生命的化学过程,例如将食物转化为能量——可能掌握着解释。他们从一个数据库中选择了预测会引起气味的代谢化合物,并使用他们的气味地图模型分析了这些分子。该团队得出结论,即使在结构上有所不同,但在代谢反应中发挥密切相关作用的分子往往闻起来相似。Mainland不是这篇单独的预印本论文的合著者,但就该项目咨询了该团队,他称这一发现“非常令人兴奋”。“我们不仅仅是构建一个模型来解决一些问题,”他说。“我们试图弄清楚这一切背后的潜在逻辑是什么。”

该模型也可能为按需记录或产生特定气味的新技术打开大门。Wiltschko将他团队的工作描述为朝着人类气味感知的“完整地图”迈进了一步。最终版本将与国际照明委员会定义的“色彩空间”相媲美,该色彩空间绘制了可见颜色。然而,牛津大学认知科学教授Asifa Majid指出,与新的嗅觉地图不同,色彩空间不依赖于文字,她没有参与这些研究。Majid质疑使用语言作为绘制人类感官知觉的基础。“说不同语言的人有不同的指称世界的方式,并且这些类别并不总是完全翻译,”她说。例如,说英语的人通常通过提及咖啡或肉桂等潜在来源来描述气味。但在马来西亚和泰国部分地区使用的一种本土语言Jahai语中,人们从12个基本气味词汇中进行选择。

Majid说,在没有经验研究来验证的情况下,“我们根本不知道这项工作将如何扩展到其他语言”。理论上,研究人员可以通过测量小组参与者在被要求比较气味时的反应时间来定义气味,而无需标签:区分相似气味更困难,因此参与者需要更多时间才能做到这一点。然而,根据Mainland的说法,这种行为方法被证明不太现实。他说,由于该模型已经学到了一些关于气味宇宙组织方式的根本性知识,他预计该地图将适用于世界其他地方。

即使有可能在不依赖文字的情况下研究人类对气味的感知,研究人员仍然缺乏以一种关键的通用语言——数字——来表示这些体验的能力。通过开发颜色空间坐标或十六进制代码(以红色、绿色和蓝色编码颜色)的嗅觉等效物,研究人员旨在以新的精度来描述气味——或许最终将其数字化。

英格兰赫特福德大学的迈克尔·施穆克使用化学信息学研究嗅觉,他没有参与这些研究,他解释说,对于视觉和听觉,研究人员已经了解了大脑关注的特征。对于嗅觉,“现在有很多事情需要解决,”他说。

一个主要的挑战是识别主要气味。为了创建数字图像的嗅觉等效物,在数字图像中,气味(如视觉)被记录并有效地重新创建,研究人员需要识别一组气味分子,当混合时,这些气味分子将可靠地产生一系列气味——就像红色、绿色和蓝色在屏幕上生成每种色调一样。

“目前这还只是非常遥远的科幻小说,尽管人们正在为此努力,”施穆克说。

© . All rights reserved.