如果我掉落一支笔,你知道它不会悬浮在半空中,而是会掉到地上。同样,如果笔在下落过程中碰到桌子,你知道它不会穿过桌面,而是会落在桌面上。
这些物理物体的基本属性对我们来说似乎是直观的。早在三个月大的婴儿就知道,看不见的球仍然存在,而且球不可能从沙发后面瞬间移动到冰箱顶部。
尽管人工智能系统已经掌握了像国际象棋和扑克这样的复杂游戏,但它们尚未展示出婴儿与生俱来或在最初几个月似乎毫不费力地获得的“常识”知识。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您将帮助确保未来能够持续发布关于塑造我们当今世界的发现和想法的有影响力的报道。
“人工智能技术已经如此先进,但我们仍然没有拥有任何类似人类常识的人工智能系统,这非常引人注目,”麻省理工学院认知科学教授约书亚·特南鲍姆(Joshua Tenenbaum)说,他曾在这个领域进行过研究。 “如果我们能够达到那个程度,那么理解它是如何运作的,它如何在人类中产生”将非常有价值。
7月11日发表在《自然人类行为》(Nature Human Behaviour)杂志上的一项研究,由谷歌母公司Alphabet的子公司DeepMind的一个团队进行,该研究朝着推进如何将这种常识知识融入机器以及理解它如何在人类中发展迈出了一步。科学家们通过将发展心理学家认为婴儿与生俱来的相同内在知识整合到人工智能系统中,提出了一个“直觉物理学”模型。他们还创建了一种测试该模型的方法,类似于用于评估人类婴儿认知的方法。
通常,在人工智能研究中变得无处不在的深度学习系统会通过训练来识别场景中的像素模式。通过这样做,他们可以识别面孔或球,但他们无法预测当这些物体被放置在动态场景中,在那里它们移动并相互碰撞时会发生什么。为了应对直觉物理学提出的更棘手挑战,研究人员开发了一个名为PLATO(通过自编码和跟踪物体进行物理学习)的模型,以关注整个物体而不是单个像素。然后,他们用大约30万个视频对PLATO进行训练,使其能够学习物体如何表现:球的掉落、撞击另一个物体或滚动到障碍物后面,然后又在另一侧重新出现。
目标是让PLATO根据五个基本概念来理解什么违反了直觉物理定律:物体恒存性(即使物体不在视野中仍然存在)、固体性(物体是物理固体)、连续性(物体以连续路径移动,不会意外地消失并在远处重新出现)、不变性(物体的属性始终保持不变)和方向惯性(物体仅在惯性定律下改变方向)。PLATO像婴儿一样,当它看到一个物体穿过另一个物体而没有在撞击时反弹回来时,表现出“惊讶”。在区分物理上可能与不可能的场景方面,它比在相同视频上训练但没有被赋予物体内在知识的传统人工智能系统表现得明显更好。
“心理学家认为人们使用物体来理解物理世界,所以也许如果我们构建一个像那样的系统,我们将最大限度地提高[人工智能模型]真正理解物理世界的可能性,”DeepMind的研究科学家路易斯·皮洛托(Luis Piloto)在一次新闻发布会上说,他领导了这项研究。
先前尝试通过将不同程度的内置或后天习得的物理知识融入系统中来教会人工智能直觉物理学的努力,取得了喜忧参半的成功。这项新研究试图以发展心理学家认为婴儿的方式来获得对直觉物理学的理解,即首先展示对物体是什么的先天意识。然后,孩子通过观察物体在世界中的移动来学习支配物体行为的物理规则。
“这篇论文令人兴奋和独特之处在于,他们非常密切地基于认知心理学和发展科学中已知的知识,”西北大学心理学教授苏珊·赫斯波斯(Susan Hespos)说,她与人合写了一篇评论文章,文章随论文一起发表,但没有参与这项研究。 “我们天生就具有先天知识,但这并不意味着当我们天生拥有它时它是完美的……然后,通过经验和环境,婴儿——就像这个计算机模型一样——扩展了这种知识。”
DeepMind的研究人员强调,在现阶段,他们的工作尚未准备好推进机器人技术、自动驾驶汽车或其他流行的AI应用。他们开发的模型需要在真实场景中涉及的物体上进行更多的训练,然后才能将其纳入人工智能系统。随着模型复杂性的提高,它也可能为发展心理学研究婴儿如何学习理解世界提供信息。关于常识知识是后天习得的还是先天固有的,发展心理学家已经争论了近100年,可以追溯到瑞士心理学家让·皮亚杰(Jean Piaget)关于认知发展阶段的研究。
“人工智能可以从发展科学中汲取思想并将其融入到他们的建模中,这可能会产生富有成效的合作,”赫斯波斯说。 “我认为这对等式的双方都可能是有益的关系。”