像孩子一样认识世界的AI

人工智能通过开始融入我们对儿童学习方式的认知而得以复兴

西蒙·普拉德斯

如果你花很多时间与孩子们相处,你一定会想知道,年幼的人类是如何在如此短的时间内学到如此多东西的。哲学家们,可以追溯到柏拉图,也曾对此感到困惑,但他们从未找到令人满意的答案。我的五岁孙子奥吉已经了解了植物、动物和时钟,更不用说恐龙和宇宙飞船了。他还能够理解别人的愿望,以及他们的想法和感受。他可以运用这些知识来分类他所看到和听到的事物,并做出新的预测。例如,他宣称最近在纽约市美国自然历史博物馆展出的一种新发现的泰坦巨龙是食草动物,所以这意味着它其实并不可怕。

然而,奥吉从他所处的环境中获得的一切,只是一连串的光子撞击他的视网膜,以及空气的扰动接触他的耳膜。他蓝色眼睛后面的神经计算机不知何故设法从他感官的有限信息开始,最终对食草泰坦巨龙做出预测。一个挥之不去的问题是,电子计算机是否也能做到同样的事情。

在过去的15年左右,计算机科学家和心理学家一直在试图找到答案。儿童在几乎没有老师或父母的指导下,就能获得大量的知识。尽管机器智能取得了巨大的进步,但即使是最强大的计算机仍然无法像五岁儿童那样学得好。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将有助于确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


弄清楚儿童大脑的实际运作方式——然后创建一个同样有效的数字版本——将在未来几十年内挑战计算机科学家。但与此同时,他们开始开发结合了我们对人类学习方式的一些认知的AI。

向上

在20世纪50年代和60年代最初的热情爆发之后,对AI的探索沉寂了几十年。但在过去的几年里,特别是在机器学习领域,已经取得了显著的进步,AI已成为技术领域最热门的发展之一。关于这些进步意味着什么,出现了许多乌托邦式或世界末日的预测。从字面上看,人们认为它们预示着永生或世界末日,并且已经有很多关于这两种可能性的文章。

我怀疑AI的发展之所以会引起如此强烈的感受,是因为我们对类人生物根深蒂固的恐惧。从中古时代的泥人到弗兰肯斯坦的怪物,再到电影《机械姬》中性感的蛇蝎美人机器人艾娃,介于人类和人造物之间的生物的想法一直令人深感不安。

但是,计算机真的像人类一样学得好吗?有多少夸张的言论指向革命性的变革,又有多少只是炒作?计算机学习识别,例如,猫、口语单词或日语字符的细节可能很难理解。但仔细观察,机器学习背后的基本思想并不像最初看起来那么令人费解。

一种方法试图通过从奥吉和我们所有人接收到的光子和空气振动流开始来解决问题——这些信息以数字图像的像素和音频记录的声音样本的形式到达计算机。然后,它尝试从数字数据中提取一系列模式,这些模式可以检测和识别周围世界中的整个物体。这种所谓的自下而上的方法根植于大卫·休谟和约翰·斯图尔特·密尔等哲学家以及伊万·巴甫洛夫和B.F.斯金纳等心理学家的思想。

在20世纪80年代,科学家们找到了一种引人注目且巧妙的方法,将自下而上的方法应用于让计算机在数据中寻找有意义的模式。“连接主义”或“神经网络”系统从神经元将视网膜上的光模式转换为周围世界表征的方式中获得灵感。神经网络的作用类似。它使用相互连接的处理元件,类似于生物细胞,将网络一层中的像素转换为越来越抽象的表示——鼻子或整个面部——随着数据在逐渐更高的层中被处理。

由于被称为深度学习的新技术——现在正由谷歌、Facebook和其他科技巨头商业化的技术,神经网络的思想最近得以复兴。计算机日益增强的算力——以摩尔定律闻名的计算能力呈指数级增长——也对这些系统的新成功起到了作用。大量数据集的开发也是如此。凭借更好的处理能力和更多的数据需要处理,连接主义系统可以比我们曾经认为的更有效地学习。

多年来,AI社区一直在偏爱这些自下而上的机器学习解决方案和替代的自上而下的方法之间摇摆不定。自上而下的方法利用系统已经知道的东西来帮助它学习新的东西。柏拉图以及勒内·笛卡尔等所谓的理性主义哲学家,都信奉自上而下的学习方法——它在早期的AI中发挥了重要作用。在21世纪初,这些方法也以概率或贝叶斯建模的形式经历了自身的复兴。

像科学家一样,自上而下的系统首先提出关于世界的抽象和广泛的假设。然后,系统根据这些假设是正确的情况下,预测数据应该是什么样子。同样像科学家一样,系统然后根据这些预测的结果修改它们的假设。

尼日利亚,伟哥和垃圾邮件

自下而上的方法也许是最容易理解的,所以让我们先考虑它们。想象一下,您正在尝试让您的计算机将重要消息与收件箱中收到的垃圾邮件分开。您可能会注意到垃圾邮件往往具有某些明显的特征:收件人地址列表很长、发件人地址在尼日利亚或保加利亚、提到100万美元的奖金,或者可能提到伟哥。但是,完全有用的消息可能看起来也一样。您不想错过您获得晋升或学术奖励的通知。

如果您将足够多的垃圾邮件示例与其他类型的电子邮件进行比较,您可能会注意到,只有垃圾邮件倾向于具有以某些明显的组合方式结合在一起的特征——例如,尼日利亚,再加上承诺100万美元的奖金,共同预示着麻烦。事实上,可能存在一些非常微妙的更高级别的模式,可以区分垃圾邮件和有用的邮件——拼写错误和完全不明显的IP地址,例如。如果您可以检测到它们,您就可以准确地过滤掉垃圾邮件——而不用担心错过您的伟哥已发货的通知。

来源:Jen Christiansen;资料来源:“通过概率程序归纳进行人类水平概念学习”,作者:Brenden M. Lake、Ruslan Salakhutdinov 和 Joshua B. Tenenbaum,发表于《科学》,第 350 卷;2015 年 12 月 11 日(贝叶斯示例)

自下而上的机器学习可以找出解决此类任务的相关线索。为此,神经网络必须经历自己的学习过程。它评估来自庞大数据库的数百万个示例,每个示例都标记为垃圾邮件或真实电子邮件。然后,计算机提取一组识别特征,将垃圾邮件与所有其他内容分开。

以类似的方式,网络可能会检查标记为“猫”、“房子”、“剑龙”等的互联网图像。通过提取每组图像中的共同特征——将所有猫与所有狗区分开来的模式——它可以识别新的猫图像,即使它以前从未见过这些特定的图像。

一种称为无监督学习的自下而上的方法仍处于相对起步阶段,但它可以检测完全没有标签的数据中的模式。它只是寻找识别对象的特征集群——例如,鼻子和眼睛总是组合在一起形成面部,并且与背景中的树木和山脉不同。在这些先进的深度学习网络中识别对象是通过劳动分工进行的,其中识别任务在网络的不同层之间分配。

2015 年《自然》杂志上的一篇文章证明了自下而上的方法已经取得了多大的进展。谷歌旗下公司 DeepMind 的研究人员以一种使计算机能够掌握 Atari 2600 视频游戏的方式,结合了两种不同的自下而上的技术——深度学习和强化学习。计算机最初对游戏的工作原理一无所知。起初,它在接收关于其表现的持续反馈的同时,对最佳动作进行随机猜测。深度学习帮助系统识别屏幕上的特征,强化学习奖励其获得高分。计算机在几款游戏中达到了很高的熟练程度;在某些情况下,它的表现优于人类专家玩家。也就是说,它在其他对人类来说同样容易掌握的游戏中也彻底失败了。更令人印象深刻的是,在 2017 年,DeepMind 使用类似的技术创建了一个掌握围棋游戏的计算机程序——并且可以击败世界上最优秀的棋手。更重要的是,该程序仅仅通过与自己对弈数百万次来做到这一点,而没有关于人类如何下棋的信息。

将AI应用于从大型数据集(数百万张Instagram图像、电子邮件消息或语音录音)中学习的能力,可以解决曾经看似令人生畏的问题,例如图像和语音识别。即便如此,值得记住的是,即使数据和训练量有限得多,我的孙子也能毫不费力地识别动物或回应口头询问。对于五岁人类儿童来说很容易的问题,对于计算机来说仍然极其复杂,并且比学习下棋困难得多。

学习识别有胡须的毛茸茸的面孔的计算机通常需要数百万个示例来对我们可以用几个示例分类的对象进行分类。经过广泛的训练,计算机可能能够识别以前从未见过的猫的图像。但它的做法与人类的概括方式截然不同。由于计算机软件的推理方式不同,因此会发生失误。一些猫的图像将不会被标记为猫。并且计算机可能会错误地说图像是猫,但实际上它只是一团随机的模糊,这永远不会愚弄人类观察者。

完全自下而上

近年来改变AI的另一种机器学习方法以相反的方向工作,从上到下。它假设我们可以从具体数据中获得抽象知识,因为我们已经知道很多,尤其是因为大脑已经能够理解基本的抽象概念。像科学家一样,我们可以使用这些概念来制定关于世界的假设,并预测如果这些假设是正确的,数据(事件)应该是什么样子——这与试图从原始数据本身中提取模式相反,就像在自下而上的AI中一样。

这个想法可以通过回顾垃圾邮件灾难来最好地说明,通过考虑我参与的一个真实案例。我收到了一封来自一家名称奇怪的期刊编辑的电子邮件,专门提到了我的一篇论文,并建议我为该刊物撰写一篇文章。没有尼日利亚,没有伟哥,没有一百万美元——这封电子邮件没有任何垃圾邮件的常见迹象。但是,通过使用我已经知道的东西,并以抽象的方式思考产生垃圾邮件的过程,我可以判断出这封电子邮件是可疑的。

首先,我知道垃圾邮件发送者试图通过迎合人类的贪婪来从人们那里榨取金钱——而学者们像普通人渴望100万美元的奖金或更好的性表现一样,渴望发表文章。我还知道,合法的“开放获取”期刊已经开始通过向作者而不是订阅者收费来支付成本。此外,我的工作与期刊标题无关。将所有这些放在一起,我提出了一个合理的假设,即这封电子邮件试图诱骗学者付费在一家假冒期刊上“发表”文章。我可以仅从一个例子中得出这个结论,并且我可以继续通过搜索引擎查询编辑的资质来进一步验证我的假设。

计算机科学家会将我的推理过程称为“生成模型”,它可以表示抽象概念,例如贪婪和欺骗。这个相同的模型也可以描述用于提出假设的过程——导致邮件可能是电子邮件诈骗的结论的推理。该模型让我解释了这种形式的垃圾邮件是如何运作的,但它也让我可以想象其他类型的垃圾邮件,甚至是一种与我以前见过或听说过的任何垃圾邮件不同的类型。当我收到来自期刊的电子邮件时,该模型让我可以反向工作——逐步追踪为什么它一定是垃圾邮件。

生成模型在20世纪50年代和60年代的第一波AI和认知科学中至关重要。但它们也有局限性。首先,原则上,大多数证据模式可能可以用许多不同的假设来解释。在我的案例中,即使看起来不太可能,电子邮件也可能是合法的。因此,生成模型必须结合关于概率的思想,这是这些方法最近最重要的发展之一。其次,构成生成模型的基本概念通常不清楚来自哪里。笛卡尔和诺姆·乔姆斯基等思想家认为,你生来就牢牢掌握了它们,但你真的生来就知道贪婪和欺骗如何导致欺诈吗?

贝叶斯模型——最近自上而下方法的一个主要例子——试图处理这两个问题。以18世纪统计学家和哲学家托马斯·贝叶斯的名字命名,它们使用一种称为贝叶斯推断的技术,将生成模型与概率论结合起来。概率生成模型可以告诉你,如果特定假设为真,你看到特定数据模式的可能性有多大。如果电子邮件是诈骗,它很可能会迎合读者的贪婪。但当然,一条消息可能会迎合贪婪,但却不是垃圾邮件。贝叶斯模型将您已经掌握的关于潜在假设的知识与您看到的数据相结合,让您可以非常精确地计算电子邮件是合法还是垃圾邮件的可能性。

这种自上而下的方法比其自下而上的对应方法更符合我们对儿童学习方式的认知。这就是为什么在过去的15年中,我和我的同事一直在关于儿童发展的工作中使用贝叶斯模型。我们的实验室和其他实验室已经使用这些技术来理解儿童如何学习因果关系,预测年轻人何时以及如何发展关于世界的新信念,以及他们何时会改变他们已经拥有的信念。

贝叶斯方法也是教机器像人一样学习的好方法。2015年,麻省理工学院的约书亚·B·特南鲍姆(我有时与他合作)、纽约大学的布伦丹·M·莱克及其同事在《科学》杂志上发表了一项研究。他们设计了一个AI系统,该系统可以识别不熟悉的手写字符,这对人类来说很简单,但对计算机来说却极其困难。

想想你自己的识别能力。即使你从未见过日语卷轴上的字符,你可能也能分辨出它与另一个卷轴上的字符是否相同或不同。你可能可以画出它,甚至设计一个假的日语字符——并且也明白它看起来与韩语或俄语字符完全不同。这正是特南鲍姆团队成员让他们的软件做的事情。

使用自下而上的方法,计算机将被呈现数千个示例,并将使用在这些示例中找到的模式来识别新字符。相反,贝叶斯程序为机器提供了一个绘制字符的通用模型:例如,笔画可以向右或向左。并且在软件完成一个字符后,它会继续下一个字符。

当程序看到给定的字符时,它可以推断出绘制它所需的笔画序列,并且它继续自己生成一组类似的笔画。它的做法与我推断出导致我收到来自期刊的可疑垃圾邮件的一系列步骤的方式相同。特南鲍姆的模型没有权衡营销诈骗是否可能导致该电子邮件,而是猜测特定的笔画序列是否可能产生所需的字符。这个自上而下的程序比应用于完全相同数据的深度学习效果好得多,并且它与人类的表现非常相似。

完美结合

这两种主要的机器学习方法——自下而上和自上而下——具有互补的优势和劣势。使用自下而上的方法,计算机一开始不需要了解任何关于猫的知识,但它确实需要大量数据。

贝叶斯系统可以从少量示例中学习,并且它可以更广泛地推广。然而,这种自上而下的方法需要预先做大量工作来阐明正确的假设集。并且两种类型的系统设计者都可能遇到类似的障碍。这两种方法仅适用于相对狭窄和定义明确的问题,例如识别书写字符或猫或玩Atari游戏。

儿童不受相同的限制。发展心理学家发现,幼儿以某种方式结合了每种方法的最佳品质——然后将它们进一步发展。奥吉可以像自上而下的系统一样,仅从一两个例子中学习。但他也以某种方式从数据本身中提取新概念,就像自下而上的系统一样。这些概念一开始并不存在。

奥吉实际上可以做更多的事情。他立即识别猫并区分字母,但他也可以做出创造性和令人惊讶的新推论,这些推论远远超出了他的经验或背景知识。他最近解释说,如果成年人想再次变成孩子,他或她应该尽量不要吃任何健康的蔬菜,因为它们会让孩子长成大人。我们几乎不知道这种创造性推理是如何产生的。事实上,在2017年发表在《美国国家科学院院刊》上的一篇论文中,我们的实验室发现儿童在这种创造性思维方面确实比成人更胜一筹。在2018年,国防部高级研究部门DARPA发布了一项征集项目,该项目可以模拟计算机中的儿童发育。

当我们听到AI是生存威胁的说法时,我们应该回顾人类思维仍然神秘的力量。人工智能和机器学习听起来很可怕。在某些方面,它们确实如此。军方正在研究使用这些系统来控制武器的方法。自然愚蠢可能比人工智能造成更大的破坏,我们人类将需要比过去更聪明,才能适当地监管新技术。摩尔定律是一种有影响力的力量:即使计算的进步来自于数据和计算机能力的量化增长,而不是我们对思维理解的概念性革命,它们仍然可能产生重大的实际后果。即便如此,我们也不应认为一个新的技术魔像即将被世界释放。

更多探索

儿童发展的贝叶斯模型。 A. Gopnik, E. Bonawitz 发表于 Wiley Interdisciplinary Reviews (WIRES) Cognitive Science, 第 6 卷,第 75-86 页;2015年。

构建像人一样学习和思考的机器。 Brenden M. Lake 等人发表于 Behavioral and Brain Sciences, 第 40 卷,文章 E253;2017年。

从童年到青春期到成年期,人类生命历史中认知灵活性和假设搜索的变化。 A. Gopnik 等人发表于 美国国家科学院院刊, 第 114 卷,第 30 期,第 7892-7899 页;2017 年 7 月 25 日。

AI 对抗 4 岁儿童。 Alison Gopnik 发表于 Possible Minds: 25 Ways of Looking at AI。John Brockman 编辑。Penguin Press(即将出版)。

艾莉森·高普尼克是加州大学伯克利分校的心理学教授和哲学附属教授。她的研究重点是幼儿如何了解他们周围的世界。

更多作者:艾莉森·高普尼克
大众科学 Magazine Vol 316 Issue 6本文最初以“让AI更像人类”为标题发表于大众科学 Magazine 第 316 卷第 6 期 (), p. 60
doi:10.1038/scientificamerican0617-60
© . All rights reserved.