黑白视觉

为何并非如此泾渭分明

你听过多少次人们说某事“非黑即白”,意思是它简单明了?而且因为黑色和白色如此明显地区分,我们自然而然地会认为,理解我们如何看到它们也一定同样简单直接。

我们错了。感知这两种颜色极端似乎很容易,但这掩盖了一个艰巨的挑战,每次我们看一个表面时,大脑都会面临这个挑战。例如,在相同的光照下,白色比黑色向眼睛反射的光线多得多。但是,阴影中的白色表面通常比阳光下的黑色表面向眼睛反射的光线少。然而,不知何故,我们能够准确地辨别出哪个是哪个。如何做到这一点?显然,大脑使用周围的环境来做出这样的判断。用于解释这种环境的具体程序对于像我这样的神经科学家来说仍然充满神秘感。

最近关于我们如何看到黑色和白色的研究,为人类视觉系统如何分析传入的光模式并正确计算物体阴影提供了见解。除了更多地解释我们自己的大脑如何工作之外,这些研究还可以帮助我们设计用于机器人的视觉系统。计算机在人们看来非常自然的模式识别方面表现得非常糟糕。如果计算机能够“看得更清楚”,它们可以提供更多服务:它们可以识别我们的面孔用于无钥匙锁,为我们开车,为我们取报纸或捡垃圾。


支持科学新闻业

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


[分割线] 询问大脑

视觉科学家使用一种称为心理物理学的方法,迫使大脑揭示其秘密。当然,大脑不会用清晰的文字与我们交谈。它更像是一个“二十问”游戏。我们只问大脑是或否的问题:你是这样工作还是那样工作?为了获得明确的答案,我们必须从至少两个相互竞争的假设开始。然后,我们必须仔细构建一个测试图像,其中包含一个关键的“目标”表面,根据一个假设,它应该看起来是浅灰色,但对于另一种竞争的解释,它应该是深灰色。通常,这些测试图像由令人愉悦的错觉组成,例如您将在本文中看到的那些。

为了理解将表面视为黑色、白色或灰色的复杂性,了解一些基本物理学知识会有所帮助。白色表面反射照射到它们的大部分光线——大约 90%。相比之下(此处为双关语),黑色表面仅反射大约 3% 的光线。当这种反射光进入称为瞳孔的眼睛开口时,晶状体将其聚焦到内后表面或视网膜上,就像光线通过镜头进入一个简单的盒式相机,然后照射到胶片上一样。视网膜中的光感受器可以测量照射到它们身上的入射光量。

到目前为止,一切都很好。但是,从我们注视的物体反射的光线本身,并不包含任何关于它反射的灰色阴影的提示。有趣的事情由此开始。

到达眼睛的光线总量更多地取决于任何场景中的照度水平,而不是任何给定表面反射的光线百分比。虽然白色表面反射的光线大约是同一光照下相邻黑色形状的 30 倍,但在明亮的阳光下,同一白色表面反射的光线可能比月光下的光线多数百万倍。实际上,明亮光线下的黑色表面很容易向眼睛发送比阴影中的白色表面更多的光线。(这就是为什么今天没有机器人能够识别其视野中物体的灰色阴影。机器人只能测量给定物体反射的光量,称为亮度。但是,正如现在清楚的那样,任何亮度都可能来自任何表面。)

认识到物体本身反射的光线包含的信息不足,心理学家汉斯·瓦拉赫在 1948 年提出,大脑通过比较从相邻表面接收的光线来确定表面的灰色阴影。瓦拉赫是阿尔伯特·爱因斯坦的表弟,他在斯沃斯莫尔学院长期任职期间进行的研究,为我们对视觉和听觉感知的认识做出了巨大贡献。他表明,即使圆盘本身从未改变,仅仅通过改变周围光线的亮度,一个均匀的圆盘就可以呈现出黑色和白色之间的任何阴影。

在一个经典的错觉中,一个灰色正方形位于白色背景上,而另一个相同的灰色正方形位于相邻的黑色背景上[参见对面页面的顶部插图]。如果感知到的亮度仅取决于反射光量,则两个正方形看起来将是相同的。黑色背景上的正方形看起来更亮——这表明大脑会比较相邻的表面。

最近的证据表明,这种相邻表面的比较可能比瓦拉赫想象的还要简单。眼睛似乎不是测量场景中每个点的光强度,而是从仅测量场景中每个边界处的亮度变化开始。

瓦拉赫的工作表明,两个表面的相对亮度是谜题的重要组成部分。但是,仅仅知道该属性仍然会留下很多歧义。换句话说,如果场景中的一块区域比相邻的一块区域亮五倍,那么这告诉眼睛什么?这两块区域可能分别是中灰色和黑色。或者它们也可能分别是白色和灰色。因此,就其本身而言,相对亮度只能告诉您两种阴影彼此之间有多么不同,而不能告诉您任何一种阴影的具体色调。为了计算表面的确切灰色,大脑需要更多东西:一个比较点,大脑可以根据该比较点来衡量各种色调,研究人员现在称之为锚定规则。

已经提出了两条锚定规则。瓦拉赫本人,以及后来的即时摄影发明者埃德温·兰德,都认为给定场景中的最高亮度会自动显示为白色。如果这条规则是正确的,那么它将作为大脑比较所有较低亮度的标准。20 世纪 40 年代心理学家哈里·海尔森创建的适应水平理论暗示,场景中的平均亮度始终显示为中灰色。然后,通过将其他亮度与此中间值进行比较来识别较浅和较深的灰色阴影。在机器视觉领域工作的研究人员称之为“灰色世界假设”。

哪个是对的?在我的实验室里,我们在 1994 年试图找出答案。我在罗格斯大学的同事和我设计了一种方法,在最简单的条件下测试这些规则:两个灰色表面,它们填充观察者的整个视野。我们要求志愿者将头部伸入一个大的不透明半球内,该半球的内部左侧涂成中灰色,右侧涂成黑色。我们将半球悬挂在一个更大的矩形腔室内,腔室内装有灯,为观看者创造漫射照明。

请记住,大脑尚不知道这两种灰色阴影是什么——它只有相对亮度。如果大脑的锚定规则基于最高亮度,那么中灰色的一半应该看起来是白色,而黑色的一半应该看起来是中灰色。但是,如果规则基于平均亮度,那么中灰色的一半应该看起来是浅灰色,而黑色的一半应该看起来是深灰色。观看者不会将任何一侧视为黑色或白色。

结果很明确。中灰色的一半看起来完全是白色;黑色的一半,中灰色。因此,我们感知到的灰度尺度锚定在“顶部”,而不是中间。这一发现告诉我们很多关于大脑如何在简单场景中计算灰色阴影的信息。最高亮度显示为白色,而较暗表面的感知灰色阴影取决于其自身亮度与具有最高亮度的表面亮度之间的差异——或者更准确地说,是比率。

[分割线] 不同的锚点

那么,日常生活中更复杂的场景呢?这种简单的算法有效吗?此时,读者可能不会惊讶地得知答案是“不,它更复杂”。如果大脑仅将每个表面的亮度与整个场景中的最高亮度进行比较,那么明亮光线下的黑色表面将与阴影中的白色表面显示为相同的阴影,前提是两者都具有相同的亮度,这种情况经常发生。但事实并非如此:我们可以辨别出它们之间的差异。那么,视觉系统必须在每个照明区域内应用不同的锚点。

事实上,许多错觉研究表明,锚点确实会发生变化。如果我将几个相同的灰色圆盘粘贴到一张有很多明亮区域和阴影的照片上,阴影区域中的圆盘将比阳光下的圆盘看起来亮得多[参见对面页面的插图]。我称这些为“探针圆盘”,因为它们使我们能够探测视觉系统如何在场景中的任何位置计算灰色阴影。在任何给定的照明区域内,圆盘的精确位置几乎无关紧要;在整个区域中,圆盘看起来大致相同的灰色阴影。

在功能上,每个区域似乎都有自己的锚点——大脑在该亮度下感知到表面看起来是白色。但是,对机器人进行编程以这种方式处理图像提出了巨大的挑战。将图片分割成具有不同照明的单独区域,需要视觉系统确定图像中的哪些边缘表示表面颜料的变化,哪些边缘表示照明水平的变化,例如阴影轮廓形成的线条。例如,这样的程序可能会将边缘分类为不同照明区域之间的边界,如果边缘模糊或表示平面断裂,例如角。

北达科他州立大学的理论家芭芭拉·布莱克斯利和马克·麦考特认为,人类视觉系统也不需要使用这种边缘分类。他们主张一种不太复杂的过程,称为空间滤波。例如,在我们的灰色圆盘图片中,他们会建议每个圆盘的灰色阴影主要取决于该圆盘边缘的局部亮度对比度(很像瓦拉赫早期的提议)。他们可能会注意到,照片中每个圆盘的明显阴影仅仅取决于每个圆盘与其直接背景之间的亮度对比度的方向和强度。

我们可以通过在阴影落在其上的棋盘上放置一些探针圆盘来测试这个简单的想法是否有效[参见上面的插图]。我们发现,具有相同局部对比度的圆盘将显示出不同的阴影。另一方面,具有不同局部对比度的圆盘可能共享相同的灰色阴影。

[分割线] 现在,大家一起

考虑另一个视觉技巧,它可以阐明大脑如何在整理光线模式时决定将哪些元素组合在一起。想象一个黑色的“加号”标志,带有两个灰色三角形[参见下一页框中的右上角]。其中一个三角形适合由加号的“肘部”形成的白色区域的弯曲处;另一个三角形伸入黑色条的一个黑色区域内。在这里,两个灰色三角形是相同的,并且它们的直接环境是相同的。每个三角形沿着其斜边(最长边)与白色接壤,而沿着另外两个等长的边与黑色接壤。但是,黑色条内部的下三角形“属于”黑色十字,而上三角形似乎是其白色背景的一部分。注意边界交叉点。当边界汇聚在一起形成一种 T 形交叉口时,大脑似乎将 T 形的柄分隔的区域定义为属于一起,而不是 T 形的顶部分隔的区域。

对 T 形交叉口的这种解释,即将其作为大脑建立分组的一种方式,也适用于澳大利亚艺术家迈克尔·怀特创作的另一种错觉。它有一系列水平黑色条,它们之间堆叠着白色空间。在其中,与白色相比,更多地被黑色包围的灰色条[参见对面页面的框中的左上角]看起来比主要被白色包围的灰色条更暗(而不是更亮)。这里,灰色条角部的 T 形交叉口表明,左侧的灰色条与白色背景位于同一平面,而右侧的灰色条与黑色条位于同一平面。

意大利帕多瓦大学心理学系的保拉·布雷桑创造了一个“地牢”错觉,进一步详细说明了大脑的分组机制。对面页面框中右中位置的灰色正方形,被黑色包围,看起来比左中位置的灰色正方形(被白色包围)更暗。

这种效果可能是因为右侧的灰色元素似乎与白色背景位于同一平面,而不是地牢窗口的黑色条。克里特大学感知研究员埃利亚斯·埃科诺穆的反向对比错觉也说明了这一点。灰色条[参见对面页面框中的右下角],即使它完全被黑色包围,也显得更暗,显然是因为它是白色条组的成员。

这些有趣的错觉有一个严肃的方面。它们表明,大脑不能仅仅通过比较两个相邻表面的亮度来计算我们感知的灰度级别。相反,周围环境以非常复杂的方式发挥作用。大多数人没有意识到问题的困难,这证明了人类视觉系统的卓越成就。

[分割线] 全局

关于大脑如何计算黑色和白色的科学共识仍有待时日。目前的理论分为三类:低级、中级和高级。基于编码局部对比度的神经空间滤波机制的低级理论,无法预测人们看到的灰色阴影。高级理论将表面灰色阴影的计算视为一种无意识的智力过程,其中自动考虑了照射到表面的光强度。这些过程可能在直觉上具有吸引力,但既没有告诉我们应该在大脑中寻找什么,也没有告诉我们如何对机器人进行编程。中级理论将每个场景解析为多个参考系,每个参考系都包含自己的锚点。与高级理论相比,这些理论更好地指定了黑色、白色和灰色阴影的计算操作,同时比低级理论更好地解释了人类对灰色表面的感知。

解码人类视觉计算可能是构建能够看到的机器人的最佳方法。但更重要的是,这可能是掌握大脑如何工作的最佳方法。

© . All rights reserved.