错觉:《蒙娜丽莎》和亚伯拉罕·林肯

这幅著名的肖像画和这位美国前总统有什么共同之处?

西班牙画家埃尔·格雷考经常在他的作品中描绘拉长的人像和物体。一些艺术史学家认为他可能患有散光——也就是说,他的眼睛的角膜或晶状体可能水平方向比垂直方向更弯曲,导致视网膜后部的图像在垂直方向上被拉伸。但当然这种想法是荒谬的。如果这是真的,那么我们都应该把世界倒过来画,因为视网膜图像是倒过来的!(晶状体翻转入射图像,大脑将视网膜上的图像解释为正立的。)这种谬误源于错误的推理,即我们真的“看到”视网膜上的图像,好像我们用某种内在的眼睛扫描它一样。

并不存在这种内在的眼睛。相反,我们需要考虑无数的视觉机制,这些机制并行地从图像中提取信息,并分阶段处理信息,然后它们的活动最终形成知觉体验。与往常一样,我们将使用一些引人注目的错觉来帮助阐明大脑在这一处理过程中的运作方式。

愤怒与平静
比较图 a 中显示的这两张面孔。如果你将页面保持在离眼睛约 9 到 12 英寸的位置,你会看到右边的面孔皱着眉头,而左边的面孔表情平静。


支持科学新闻事业

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻事业 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


但是,如果你移动图片,使其距离约六到八英尺远,表情就会改变。左边的现在笑了,右边的看起来平静。

这种转变是如何可能的?这似乎几乎是神奇的。为了帮助你理解它,我们需要解释格拉斯哥大学的菲利普·G·辛斯和麻省理工学院的奥德·奥利瓦是如何构建这些图像的。

正常的肖像(照片或绘画)包含神经科学家(例如我们自己)所说的“空间频率”的变化。我们将讨论两种类型的空间频率:第一种是“高”——图片中存在清晰、精细的线条或细节。第二种是“低”——由模糊的边缘或大型物体传达。(事实上,大多数图像都包含从高到低的频率频谱,比例和对比度各不相同,但这对于本专栏的目的来说并不重要。)

使用计算机算法,我们可以处理正常的肖像,以去除高空间频率或低空间频率。例如,如果我们去除高频率,我们得到一个模糊的图像,据说它包含“傅里叶空间中的低空间频率”。(这种数学描述在这里不必进一步关注。)换句话说,这种模糊过程称为低通滤波,因为它滤除高空间频率(清晰的边缘或精细的线条),只让低频率通过。高通滤波,相反的过程,保留清晰的边缘和轮廓,但去除大尺度的变化。结果看起来有点像没有阴影的轮廓图。

这些类型的计算机处理图像以非典型的方式组合在一起,以创建图 a 中显示的神秘面孔。研究人员从三张面孔的正常照片开始:一张平静的,一张愤怒的和一张微笑的。他们过滤每张面孔以获得高通(包含清晰、精细的线条)和低通(模糊,以便捕捉大尺度亮度变化)图像。然后,他们将高通平静的面孔与低通微笑的面孔组合起来,得到左边的图像。对于右边的图像,他们将高通皱眉的面孔与低通平静的面孔叠加在一起。

当近距离观看这些图形时会发生什么?为什么当你将页面移开时,表情会改变?为了回答这些问题,我们需要告诉你更多关于视觉处理的两件事。首先,图像需要靠近才能看到清晰的特征。其次,清晰的特征在可见时会“掩盖”——或将注意力从——大尺度物体(低空间频率)上转移开。

因此,当你将图片靠近时,清晰的特征变得更加可见,掩盖了粗糙的特征。结果,右边的面孔看起来像在皱眉,而左边的面孔看起来像在放松。你根本没有注意到低空间频率传达的相反情绪。然后,当你将页面移得更远时,你的视觉系统不再能够分辨精细的细节。因此,这些精细特征所传达的表情消失了,而低频率所传达的表情则被解除掩盖并被感知到。

该实验生动地展示了最初由剑桥大学的弗格斯·坎贝尔和约翰·罗布森提出的一个想法:来自不同空间尺度的信息由各种神经通道并行提取,这些通道具有广泛的感受野大小。(视觉神经元的感受野是视觉场的一部分,以及相应的视网膜小区域,刺激需要呈现给该区域才能激活它。)它还表明,这些通道并非彼此孤立地工作。相反,它们以有趣的方式相互作用(例如,小感受野拾取的清晰边缘掩盖了由大感受野发出信号的模糊的大尺度变化)。

诚实的亚伯
这类实验可以追溯到 1960 年代初期,当时在贝尔实验室工作的莱昂·哈蒙设计了著名的亚伯拉罕·林肯效应。哈蒙通过拍摄一张普通照片并将其数字化为粗像素(图像元素)制作了诚实的亚伯的图片。即使近距离观看,块状亮度变化中也存在足够的信息来识别林肯。但是,正如我们已经指出的那样,这些数据被像素的清晰边缘掩盖了。当你远离照片或眯起眼睛时,图像会模糊,从而消除清晰的边缘。瞧!林肯瞬间变得可识别。伟大的艺术家萨尔瓦多·达利受到了这种错觉的充分启发,并将其用作他绘画的基础,这是艺术和科学的非同寻常的并置。

神秘的《蒙娜丽莎》
最后,考虑一下列奥纳多·达·芬奇的《蒙娜丽莎》神秘的微笑。专门研究美学的哲学家和艺术史学家经常将她的表情称为“神秘的”或“难以捉摸的”,主要是因为他们不理解它。事实上,我们怀疑他们是否宁愿不理解它,因为他们似乎对任何试图科学地解释它的尝试感到不满,显然是担心这种分析可能会减损它的美感。

但最近,哈佛医学院的神经生物学家玛格丽特·利文斯通做出了一个有趣的观察;你可以说她破解了达·芬奇密码。她注意到,当她直视蒙娜丽莎的嘴时,微笑并不明显(相当令人失望)。然而,当她将目光从嘴上移开时,微笑出现了, beckoning 她的眼睛回到原处。再次看着嘴,她看到微笑再次消失。事实上,她指出,只有当你将目光从嘴上移开时,才能看到这种难以捉摸的微笑。你必须用眼角的余光注意它,而不是直接盯着它看。由于嘴角独特的阴影(低空间频率的放置),只有当低空间频率占主导地位时——也就是说,当你间接地观看这幅杰作时,才能感知到微笑。

为了证实这一观点,她对《蒙娜丽莎》进行了低通滤波和高通滤波。请注意,在低通(模糊)图像中,微笑比在原始图像中更明显——即使你直视嘴巴也能看到。然而,在高通(轮廓状)图像中,即使你将目光从嘴上移开,也看不到微笑。将这两张图像放回一起,恢复了原始的杰作和微笑的难以捉摸的本质。与不断变化的面孔一样,我们现在可以更好地理解列奥纳多似乎偶然发现并爱上的东西——一幅似乎栩栩如生的肖像,因为其转瞬即逝的表情(归功于我们视觉系统的怪癖)永远在挑逗观众。

总的来说,这些实验表明,感知不仅仅是眼睛所看到的。更具体地说,它们证明了来自不同尺度(例如精细与粗糙)的信息最初可能由单独的神经通道从图像中提取,并在处理的不同阶段重新组合,从而在你的脑海中创建单个统一图片的最终印象。

(延伸阅读)

  • 微笑博士和愤怒先生:当分类灵活地改变快速视觉呈现中面孔的感知时。菲利普·G·辛斯和奥德·奥利瓦发表于《认知》,第 69 卷,第 3 期,第 243–265 页;1999 年。

维拉亚努尔·S·拉马钱德兰是加州大学圣地亚哥分校脑与认知中心教授兼主任。拉马钱德兰的荣誉包括获得伦敦英国皇家学会的亨利·戴尔奖、为 BBC 举办 2003 年里斯讲座以及参加 2012 年在格拉斯哥举行的吉福德讲座。

更多作者:维拉亚努尔·S·拉马钱德兰
SA Mind Vol 20 Issue 6本文最初以“错觉:破解达·芬奇密码”为标题发表于SA Mind 第 20 卷第 6 期(),第 22 页
doi:10.1038/scientificamericanmind1109-22
© . All rights reserved.