人类的学习方式与计算机相同吗?认知心理学家已经争论这个问题几十年了,但在过去的几年里,深度学习计算机系统取得了显著成就,这尤其激起了研究物体识别的研究人员的热情。
无论树木或狗的大小、颜色或观看角度如何,人类都能毫不费力地知道树是树,狗是狗。事实上,识别这些视觉元素是儿童最早学习的任务之一。但研究人员一直在努力确定大脑如何进行这种简单的评估。随着深度学习系统开始掌握这种能力,科学家们开始询问计算机分析数据(尤其是图像)的方式是否与人脑相似。“人类的思想,人类的视觉系统,理解形状的方式是一个困扰人们许多代人的谜团,部分原因是它如此直观,但又非常难以编程,”罗格斯大学心理学教授雅各布·费尔德曼说。
6 月份发表在 Scientific Reports 上的一篇论文比较了各种物体识别模型,得出的结论是,人们不是像计算机处理像素那样评估物体,而是基于想象的内部骨架。在这项研究中,埃默里大学的研究人员在心理学副教授斯特拉·洛伦佐的带领下,想知道人们是否根据物体的骨架(物体形状表面下贯穿中心的无形轴)来判断物体的相似性。科学家们生成了 150 个独特的 3D 形状,这些形状围绕 30 个不同的骨架构建,并要求参与者确定两个物体是否相同。果然,骨架越相似,参与者就越有可能将物体标记为相同。研究人员还比较了其他模型(如神经网络(基于人工智能的系统)和基于像素的物体评估)在预测人们决策方面的表现。虽然其他模型在任务上的表现也相当不错,但骨架模型始终胜出。
支持科学新闻报道
如果您喜欢这篇文章,请考虑支持我们屡获殊荣的新闻报道,方式是 订阅。通过购买订阅,您正在帮助确保有关塑造当今世界的发现和想法的具有影响力的故事的未来。
“对于解决这些物体识别问题,人们非常重视深度神经网络。这些网络需要大量的训练才能学习单个物体类别,而我们研究的模型,即骨架模型,似乎无需这种经验就能做到这一点,”洛伦佐实验室的博士生弗拉迪斯拉夫·艾森伯格说。“我们的研究结果表明,即使将骨架模型与这些其他成熟的物体识别神经网络模型进行比较,人类也可能通过其内部骨架来识别物体。”
接下来,研究人员将骨架模型与其他形状识别模型(例如侧重于轮廓的模型)进行了对比。为此,艾森伯格和洛伦佐以某些方式操纵物体,例如移动手臂相对于身体其余部分的位置,或改变轮廓的粗细、凸起或波浪形程度。人们再次根据物体的骨架而不是其表面质量来判断物体是否相似。
“这是一流的工作,我对结果印象非常深刻,”未参与这项研究的费尔德曼说。“他们确实给出了经验证据——我会说它比我以前见过的任何东西都更有说服力地证明,人类大脑通过形状骨架的相似性来计算形状相似性。”
这项研究的一个担忧是,作者专门从骨架生成物体,而不是从形状(无论是天然的还是人造的)中推导出物体,这些形状被皮肤、金属或其他人们在日常生活中遇到的材料覆盖。“他们生成的形状与他们正在测试的假设和他们正在得出的结论直接相关,”多伦多约克大学人类和计算机视觉教授詹姆斯·埃尔德说。“如果我们对骨架对形状和物体感知的重要性感兴趣,我们就不能仅仅通过观察骨架生成的形状的感知来回答这个问题。因为显然在骨架生成的形状的世界中,骨架可能相当重要,因为形状就是这样制作出来的。”
埃尔德认为,虽然该模型可能解释了人们对具有清晰定义的骨架的形状(如动物或树木)的解释,但它不适用于所有类型的形状,如岩石或揉成一团的报纸。艾森伯格说,他们正在后续研究中使用 传统形状 和自然物体来解决这个问题。
研究人员现在想知道骨架模型是否可以融入深度学习系统,这样科学家们就可以帮助计算机像人类一样学习,而不是探索人类是否像计算机一样学习。
“我们乐观地认为,它也将有助于和启发试图模拟人类感知的神经网络,”洛伦佐说。“它们以令人震惊的方式崩溃,而人类不会,因此,了解人类如何识别物体对于它们来说也非常重要。”