普利策奖获奖书籍《哥德尔、埃舍尔、巴赫》在 1979 年启发了无数计算机科学家,但很少有人像 梅兰妮·米歇尔 那样受到启发。在阅读了这本 777 页的巨著后,当时在纽约担任高中数学教师的米歇尔决定她“需要进入”人工智能领域。她很快找到了这本书的作者,人工智能研究员道格拉斯·霍夫施塔特,并说服他给她一个实习机会。当时她只上过几门计算机科学课程,但他似乎对她的胆识印象深刻,并且并不在意她的学历。
米歇尔准备了一份“最后一刻”的研究生院申请,并加入了霍夫施塔特在密歇根大学安娜堡分校的新实验室。接下来的六年里,两人密切合作开发了 Copycat,这是一个计算机程序,用其共同创造者的话来说,该程序旨在“以心理学上现实的方式发现有洞察力的类比”。
Copycat 想出的 类比是字母的简单模式之间的类比,类似于标准化测试中的类比。一个例子是:“如果字符串 ‘abc’ 变为字符串 ‘abd’,那么字符串 ‘pqrs’ 会变为什么?” 霍夫施塔特和米歇尔认为,理解类比的认知过程——人类如何在相似的想法、感知和经验之间建立抽象联系——对于解锁类人人工智能至关重要。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
米歇尔认为,类比可以比考试式的模式匹配深入得多。“这是通过将一种情况映射到另一种已经理解的情况来理解情况的本质,”她说。“如果你告诉我一个故事,我说,‘哦,同样的事情发生在我身上,’字面上看,发生在你身上的事情并没有发生在我身上,但我可以进行映射,使其看起来非常相似。这是我们人类一直在做的事情,甚至没有意识到我们正在这样做。我们不断地沉浸在类比的海洋中。”
作为圣塔菲研究所的戴维斯复杂性教授,米歇尔的研究已经扩展到机器学习之外。她目前正在领导 SFI 的 自然和人工智能系统智能基础 项目,该项目将在明年召开一系列跨学科研讨会,探讨生物进化、集体行为(如蚂蚁等社会性昆虫的集体行为)和物理身体如何共同促进智能。但类比的作用在她工作中比以往任何时候都更加突出,尤其是在人工智能领域——过去十年中,人工智能领域的主要进展很大程度上是由深度神经网络推动的,深度神经网络是一种模仿哺乳动物大脑中神经元分层组织的技术。
“当今最先进的神经网络在某些任务上非常出色,”她说,“但它们非常不擅长将在一种情况下学到的东西转移到另一种情况中”——这正是类比的本质。
Quanta 与米歇尔谈论了人工智能如何进行类比,该领域迄今为止从中学到了什么,以及下一步需要走向何方。采访内容经过浓缩和编辑,以求清晰。
为什么类比对于人工智能如此重要?
这是一种基本的思维机制,将帮助人工智能达到我们期望的水平。有些人说,能够预测未来是人工智能的关键,或者能够拥有常识,或者能够在当前情况下检索有用的记忆。但在这些事情中,类比都非常核心。
例如,我们想要自动驾驶汽车,但问题之一是,如果它们面临的情况与它们接受训练的情况略有不同,它们就不知道该怎么做。我们人类如何在以前没有遇到过的情况下知道该怎么做?嗯,我们使用与先前经验的类比。这也是我们在现实世界中需要这些人工智能系统也能够做到的事情。
但您也 写道 类比是“人工智能中一个研究不足的领域”。如果它如此重要,为什么会这样呢?
人们没有对其进行更多研究的一个原因是,他们没有认识到它对认知的本质重要性。早期的人工智能的工作方式是专注于逻辑和行为规则的编程。最近,人们专注于从大量示例中学习,然后假设您将能够使用已经学到的东西的统计数据对以前没有见过的事物进行归纳。他们希望泛化和抽象能力能够从统计数据中产生,但效果不如人们预期的那么好。
例如,您可以向深度神经网络展示数百万张桥梁的图片,它可能可以识别出新的河流或其他物体上的桥梁图片。但它永远无法将“桥梁”的概念抽象为,例如,我们弥合性别差距的概念。事实证明,这些网络并没有学会如何抽象。有些东西缺失了。人们现在才开始努力解决这个问题。
梅兰妮·米歇尔是圣塔菲研究所的戴维斯复杂性教授,她从事数字思维研究已有数十年。她说,除非人工智能能够做一些人类独有的事情:进行类比,否则人工智能永远不会真正“智能”。图片来源:Emily Buder Quanta Magazine;Gabriella Marks for Quanta Magazine
它们永远学不会抽象吗?
有一些新的方法,例如元学习,机器可以“学习更好地学习”。或者自我监督学习,像 GPT-3 这样的系统学习用缺失的词语填补句子,这使其能够非常、非常令人信服地生成语言。有些人会认为,像这样的系统最终会通过足够的数据学会执行这种抽象任务。但我不这么认为。
您将这种局限性描述为 “意义的障碍”——人工智能系统可以在某些条件下模仿理解,但在这些条件之外变得脆弱且不可靠。您为什么认为类比是我们摆脱这个问题的方法?
我的感觉是,解决脆弱性问题将需要意义。这最终导致了脆弱性问题:这些系统在任何类似人类的意义上都不理解它们正在处理的数据。
“理解”这个词是这些谁都无法就其真正含义达成一致的“手提箱词”之一——几乎就像我们尚无法解释的精神现象的占位符。但我认为这种抽象和类比机制是人类所称的理解的关键。它是理解发生的一种机制。我们能够将我们已经以某种方式知道的东西映射到新的东西。
所以类比是一种让生物体保持认知灵活性的方式,而不是像机器人一样行动?
我认为在某种程度上是的。类比不仅仅是我们人类所做的事情。有些动物有点像机器人,但其他物种能够将先前的经验映射到新的经验。也许这是一种将智能谱系放置在不同类型的生命系统上的方式:在多大程度上您可以进行更抽象的类比?
人类拥有这种特殊智能的理论之一是,这是因为我们是如此社会化。您要做的最重要的事情之一是模拟其他人的想法,了解他们的目标并预测他们将要做什么。而这是您通过与自己的类比来完成的事情。您可以将自己置于他人的位置,并将自己的思想映射到他们的思想上。这种“心智理论”是人工智能领域的人们一直在谈论的事情。它本质上是一种进行类比的方式。
您的 Copycat 系统是早期尝试用计算机做到这一点的系统。还有其他的吗?
“结构映射” 在人工智能方面的工作侧重于情境的基于逻辑的表示以及在它们之间进行映射。肯·福布斯和其他人使用了 [欧内斯特·卢瑟福在 1911 年提出的] 太阳系与原子的著名类比 [由欧内斯特·卢瑟福在 1911 年提出]。他们会有一组句子 [以称为谓词逻辑的形式化符号表示] 描述这两种情况,并且他们根据它们的结构而不是句子的内容来映射它们。这个概念非常强大,我认为它是正确的。当人类试图理解相似之处时,我们更关注关系而不是特定对象。
为什么这些方法没有流行起来?
学习的整个问题在很大程度上被排除在这些系统之外。结构映射会采用这些充满了人类意义的词语——例如“地球绕太阳旋转”和“电子绕原子核旋转”——并将它们相互映射,但没有关于“绕……旋转”意味着什么的内部模型。它只是一个符号。Copycat 在字母串方面效果很好,但我们缺少的是如何扩展它并将其推广到我们实际关心的领域的答案?
深度学习以其良好的可扩展性而闻名。它在产生有意义的类比方面更有效吗?
有一种观点认为,深度神经网络在其输入层和输出层之间进行某种魔术。如果它们在识别不同种类的犬种方面比人类更出色——它们确实如此——那么它们应该能够解决这些非常简单的类比问题。因此,人们会创建一个大型数据集来训练和测试他们的神经网络,并发表一篇论文说:“我们的方法在这个测试中获得了 80% 的正确率。” 而另一个人会说:“等等,你的数据集有一些奇怪的统计特性,可以让机器学习如何在不具备泛化能力的情况下解决它们。这是一个新的数据集,你的机器在这个数据集上表现非常糟糕,但我们的机器表现出色。” 这种情况不断发生。
问题是,如果您必须在成千上万个示例上对其进行训练,那么您就已经输掉了这场战斗。这不是抽象的全部意义所在。这完全是机器学习领域的人们所说的“少样本学习”,这意味着您在非常少量的示例上进行学习。这才是抽象的真正用途。
那么还缺少什么?为什么我们不能像拼乐高积木一样将这些方法组合在一起?
我们没有告诉您如何做到这一点的说明书!但我确实认为我们必须将它们像乐高积木一样组合在一起。这就是这项研究的前沿:所有这些事物的关键见解是什么,以及它们如何相互补充?
很多人对 抽象和推理语料库 [ARC] 非常感兴趣,这是一个围绕 人类基本上与生俱来的“核心知识” 构建的非常具有挑战性的少样本学习任务。我们知道世界应该被解析为对象,并且我们对空间的几何形状有所了解,例如某个物体在另一个物体之上或之下 [其他物体]。在 ARC 中,有一个颜色网格以人类能够用这种核心知识描述的方式变成另一个颜色网格——例如,“一种颜色的所有正方形都向右移动,另一种颜色的所有正方形都向左移动。” 它为您提供了一个这样的示例,然后要求您对另一个颜色网格执行相同的操作。
我非常把它看作是一个类比挑战。您试图找到对从一张图像到新图像的变化的某种抽象描述,并且您无法学习任何奇怪的统计相关性,因为您只有两个示例。如何让机器学习和推理婴儿拥有的这种核心知识——这是我迄今为止提到的所有系统都无法做到的事情。这就是为什么它们都无法处理这个 ARC 数据集的原因。这有点像圣杯。
如果婴儿天生就具有这种“核心知识”,那么这是否意味着人工智能要进行这种类比,也需要像我们一样的身体?
这是价值百万美元的问题。这是一个非常有争议的问题,人工智能界对此没有共识。我的直觉是,是的,如果没有某种具身性,我们将无法在人工智能中获得类似人类的类比。拥有身体可能是必不可少的,因为其中一些视觉问题需要您从三维角度思考它们。对我来说,这与生活在这个世界上并移动我的头部,以及理解事物在空间上是如何相关的有关。我不知道机器是否必须经历那个阶段。我认为它可能会经历。
经 Quanta Magazine 许可转载,Quanta Magazine 是 西蒙斯基金会 的一个编辑独立的出版物,其使命是通过报道数学、物理和生命科学领域的研究进展和趋势来增进公众对科学的理解。阅读 原始文章。