前瞻性研究:教导计算机像人类一样看世界

麻省理工学院的研究人员正在利用人类视觉的计算机模型来改进图像识别软件

加入我们的科学爱好者社区!

尽管计算机已经非常精密,但它们仍然无法与大自然的恩赐——大脑相媲美。大脑能够快速而准确地对物体进行分类,从而使人类和灵长类动物能够即时解读他们所看到的东西。尽管经过了几十年的发展,计算机视觉系统仍然会被大量必要的数据所困扰,而这些数据仅仅是为了识别最基本的图像。如果将同一张图像置于不同的环境中,或者改变光照条件,那么人工智能就更无法与优秀的灰质相提并论了。

随着对安全系统的需求增长,这些缺点变得更加紧迫。这些安全系统需要在拥挤的机场中识别已知的恐怖分子面孔,以及汽车安全机制,例如当传感器检测到行人或另一辆车在汽车行驶路径上时可以踩刹车的传感器。为了寻求前进的方向,麻省理工学院的研究人员正在研究神经科学的进展,以寻求改进人工智能的方法,反之亦然。该校在神经科学和计算机科学领域的顶尖人才正在汇集他们的研究成果,将复杂的大脑计算模型与他们在图像处理方面的工作相结合。

这种跨学科的方法在一年前开始取得成果,当时由麻省理工学院麦戈文脑研究所的研究员、该校脑与认知科学系的教授托马索·波吉奥领导的一组研究人员,使用了一种受大脑启发的计算机模型来解读一系列照片。虽然这种神经模型最初是作为大脑中某些视觉通路如何工作的理论分析而开发的,但事实证明,在快速识别一些复杂场景方面,它与现有的最佳计算机视觉系统一样好,甚至更好。此前,当一台计算机被展示马的图片,以及站在森林中的其他动物,并被要求每次识别马时,它会被所有可能将马与其他动物或树木区分开来的数据所淹没。


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻事业 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


波吉奥说,当使用神经模型时,这是计算机模型首次能够在这种任务上重现人类行为,这使研究人员更接近于理解视觉皮层如何识别物体和场景。

波吉奥说,多年来,一些汽车公司一直试图开发计算机系统,使其车辆能够在拥挤的背景中识别行人和其它车辆,并在驾驶员过于靠近时向其发出警告。波吉奥说,这种类型的识别对人类来说非常容易,但是“当我们这样做时,我们并没有意识到我们的大脑中发生了什么。”

当一个人看到一张图片时,即使只是一瞬间,大脑的视觉皮层也会立即识别出它所看到的东西。视觉皮层是大脑处理系统的重要组成部分,也是最复杂的部分之一。波吉奥说,理解它的工作原理可能是了解整个大脑如何运作的重要一步。他说:“视觉只是智能的代表。” 人类的大脑更清楚它是如何解决复杂问题的,例如下棋或解代数方程,这就是为什么计算机程序员在构建模拟这类活动的机器方面取得了如此大的成功。

到目前为止,波吉奥的研究已经模拟了“前馈”视觉,即当图像首次呈现给眼睛时发生的视觉。他和他的同事现在正在研究开发新的模型,以帮助他们更好地理解一旦眼睛开始扫描图像中描绘的场景并解释场景中物体之间的空间关系时,大脑是如何工作的。希望这最终将导致计算机软件能够做同样的事情,并最终不仅解释人类的快速认知,还能解释我们视觉智能的其他方面。请密切关注。

© . All rights reserved.