你听过多少次人们说某件事是“黑白的”,意思是它很简单或一清二楚?而且因为黑色和白色如此明显不同,我们自然会认为理解我们如何看到它们也一定同样直截了当。
我们错了。感知这两种颜色极端看似容易,但它隐藏着大脑每次观察物体表面时都会面临的艰巨挑战。例如,在相同的照明条件下,白色比黑色向眼睛反射的光线多得多。但是,阴影中的白色表面通常比阳光下的黑色表面向眼睛反射的光线少。尽管如此,我们仍然可以准确地辨别出哪个是哪个。如何做到?显然,大脑使用周围环境来做出这样的判断。用于解释这种环境的具体程序对于像我这样的神经科学家来说仍然充满神秘。
最近关于我们如何看到黑色和白色的研究,为人类视觉系统如何分析传入的光线模式并正确计算物体阴影提供了见解。除了更多地解释我们自己的大脑如何工作之外,这类研究还可以帮助我们设计用于机器人的视觉系统。计算机在人们自然而然地进行的模式识别方面非常糟糕。如果计算机能够“看得更清楚”,它们就能提供更多的服务:它们可以识别我们的面孔以实现无钥匙锁,为我们在城镇周围驾驶,为我们带来报纸或捡起垃圾。
支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
询问大脑
视觉科学家使用一种称为心理物理学的方法迫使大脑揭示其秘密。当然,大脑不会用清晰的文字与我们交谈。相反,它就像一个“二十个问题”的游戏。我们只问大脑是或否的问题:你是这样工作还是那样工作?为了获得明确的答案,我们必须从至少两个相互竞争的假设开始。然后我们必须仔细构建一个测试图像,其中包含一个关键的“目标”表面,根据一个假设,它应该看起来是浅灰色,但对于另一种竞争的解释,它应该是深灰色。通常,这些测试图像由令人愉悦的错觉组成,例如您将在本文中看到的那些。
为了理解将表面视为黑色、白色或灰色的复杂性,从一些基本物理学知识入手会有所帮助。白色表面反射大部分照射到它们的光——大约 90%。相比之下(此处双关语并非有意),黑色表面仅反射大约 3% 的光。当这种反射光进入称为瞳孔的眼睛开口时,晶状体将其聚焦到内后表面,即视网膜上,就像光线通过晶状体进入一个简单的盒子相机,然后照射到胶片上一样。视网膜中的光感受器可以测量照射到它们身上的入射光量。
到目前为止,一切都很好。但是,从我们观察的物体反射的光本身,并没有包含它反射的灰色阴影的任何提示。这就是事情变得有趣的地方。
到达眼睛的光线总量更多地取决于任何场景中的照明水平,而不是任何给定表面反射的光线百分比。虽然白色表面反射的光线大约是同一照明条件下相邻黑色形状的 30 倍,但在明亮的阳光下,同一白色表面反射的光线可能是月光下的数百万倍。实际上,明亮光线下的黑色表面很容易比阴影中的白色表面向眼睛发送更多的光线。(这就是为什么今天没有机器人能够识别其视野中物体的灰色阴影。机器人只能测量给定物体反射的光量,称为亮度。但是,正如现在清楚的那样,任何亮度都可能来自任何表面。)
认识到物体本身反射的光线包含的信息不足,心理学家汉斯·瓦拉赫在 1948 年提出,大脑通过比较来自相邻表面的光线来确定表面的灰色阴影。瓦拉赫是阿尔伯特·爱因斯坦的表亲,在他于斯沃斯莫尔学院长期任职期间进行的研究中,为我们对视觉和听觉感知的知识做出了巨大贡献。他表明,仅仅通过改变周围光线的亮度,即使圆盘本身从未改变,均匀的圆盘也可能呈现黑色和白色之间的任何阴影。
在一个经典的错觉中,一个灰色正方形位于白色背景上,而一个相同的灰色正方形位于相邻的黑色背景上[参见对面页面的顶部插图]。如果感知的亮度完全取决于反射的光量,则这两个正方形看起来是相同的。黑色背景上的正方形看起来更亮——这向我们表明,大脑会比较相邻的表面。
最近的证据表明,这种相邻表面的比较可能比瓦拉赫想象的还要简单。眼睛似乎不是测量场景中每个点的光强度,而是首先仅测量场景中每个边界处亮度的变化。
瓦拉赫的工作表明,两个表面的相对亮度是谜题的重要组成部分。但是,仅知道该属性仍然会留下很多歧义。换句话说,如果场景中的一块区域比相邻的一块区域亮五倍,这告诉眼睛什么?这两块区域可能分别是中灰色和黑色。或者它们也可能是白色和灰色。因此,相对亮度本身只能告诉您两种阴影彼此之间有多大差异,而不能告诉您任何一种阴影的具体色调。为了计算表面的确切灰色,大脑需要更多的东西:一个可以用来衡量各种色调的比较点,研究人员现在称之为锚定规则。
已经提出了两个锚定规则。瓦拉赫本人,以及后来的即时摄影发明家埃德温·兰德,都提出场景中最高的亮度会自动呈现白色。如果这是真的,那么这条规则将作为大脑比较所有较低亮度的标准。心理学家哈里·海尔森在 20 世纪 40 年代创建的适应水平理论暗示,场景中的平均亮度始终呈现中灰色。然后,通过将其他亮度与此中间值进行比较来识别更浅和更深的灰色阴影。那些从事机器视觉工作的人称之为“灰色世界假设”。
哪个是对的?在我的实验室里,我们试图在 1994 年找出答案。我和我在罗格斯大学的同事设计了一种方法,在最简单的条件下测试这些规则:两个灰色表面,它们填充了观察者的整个视野。我们要求志愿者将他们的头部放入一个大的不透明半球内,该半球的内部左侧涂成中灰色,右侧涂成黑色。我们将半球悬挂在一个更大的矩形腔室内,腔室内的灯光为观察者创造漫射照明。
请记住,大脑还不知道这两种灰色阴影是什么——它只有相对亮度。如果大脑的锚定规则是基于最高亮度,那么中灰色的一半应该看起来是白色,而黑色的一半应该看起来是中灰色。但如果规则是基于平均亮度,那么中灰色的一半应该看起来是浅灰色,而黑色的一半应该看起来是深灰色。观察者不会看到任何一侧是黑色或白色。
结果很明确。中灰色的一半看起来完全是白色;黑色的一半,中灰色。因此,我们感知的灰度级锚定在“顶部”,而不是中间。这一发现告诉我们很多关于大脑如何在简单场景中计算灰色阴影的信息。最高亮度呈现白色,而较暗表面的感知灰色阴影取决于其自身亮度与具有最高亮度的表面亮度之间的差异——或者更准确地说,是比率。
不同的锚点
那么日常生活中更复杂的场景呢?这种简单的算法有效吗?此时,读者可能不会惊讶地得知答案是:“不,它更复杂。”如果大脑仅将每个表面的亮度与整个场景中的最高亮度进行比较,那么明亮光线下的黑色表面将与阴影中的白色表面呈现相同的阴影,前提是两者都具有相同的亮度,这种情况经常发生。但事实并非如此:我们可以辨别出它们之间的差异。然后,视觉系统必须在每个照明区域内应用不同的锚点。
事实上,许多错觉的研究表明,锚点确实会发生变化。如果我在一张有很多明亮区域和阴影的照片上粘贴几个相同的灰色圆盘,阴影区域中的圆盘看起来会比阳光下的圆盘亮得多[参见对面页面的插图]。我称这些为“探针圆盘”,因为它们使我们能够探究视觉系统如何在场景中的任何位置计算灰色阴影。在任何给定的照明区域内,圆盘的精确位置无关紧要;圆盘在整个区域内呈现大致相同的灰色阴影。
从功能上讲,每个区域似乎都有自己的锚点——大脑在该亮度下感知表面呈现白色。但是,为机器人编程以这种方式处理图像提出了巨大的挑战。将图片分割成具有不同照明的单独区域需要视觉系统确定图像中的哪些边缘表示表面颜色的变化,哪些边缘(例如阴影轮廓形成的线)表示照明水平的变化。例如,这样的程序可能会将边缘分类为不同照明区域之间的边界,如果它是模糊的,或者如果它表示平面断裂,例如角落。
北达科他州立大学的芭芭拉·布莱克斯利和马克·麦考特等理论家认为,人类视觉系统无需使用这种边缘分类。他们主张一种不太复杂的过程,称为空间滤波。例如,在我们的带有灰色圆盘的图片中,他们会建议每个圆盘的灰色阴影主要取决于该圆盘边缘的局部亮度对比度(很像瓦拉赫早期的提议)。他们可能会注意到,照片中每个圆盘的明显阴影仅取决于每个圆盘与其直接背景之间亮度对比度的方向和强度。
我们可以通过将一些探针圆盘放在有阴影落在其上的棋盘上来测试这个简单的想法是否有效[参见上面的插图]。我们发现,具有相同局部对比度的圆盘将呈现不同的阴影。另一方面,具有不同局部对比度的圆盘可能共享相同的灰色阴影。
现在一起
考虑另一个视觉技巧,它可以揭示当大脑整理光线模式时,如何决定将哪些元素组合在一起。想象一个黑色的“加号”,带有两个灰色三角形[参见下一页方框右上角]。其中一个三角形嵌入到加号“肘部”形成的白色区域的弯曲处;另一个三角形伸入黑色横条之一的黑色区域内。在这里,两个灰色三角形是相同的,它们的直接环境也是相同的。每个三角形沿其斜边(最长边)与白色相邻,而沿另外两条等长的边与黑色相邻。但是,较低的三角形,在黑色横条内,“属于”黑色十字,而上面的三角形似乎是其白色背景的一部分。注意边界交汇处。当边界汇聚在一起形成一种 T 形连接时,大脑似乎将 T 形茎分隔的区域定义为属于一起,而不是 T 形顶部区域。
这种将 T 形连接解释为大脑建立分组方式的方法也适用于澳大利亚艺术家迈克尔·怀特创作的另一种错觉。它有一系列水平的黑色横条堆叠在一起,中间有白色空间。在其中,与白色相比,更多地与黑色相邻的灰色横条[参见对面页面的方框左上角]看起来比主要与白色相邻的灰色横条更暗(而不是更亮)。这里,灰色横条角部的 T 形连接表明,左侧的灰色横条与白色背景位于同一平面,而右侧的灰色横条与黑色横条位于同一平面。
意大利帕多瓦大学心理学系的保拉·布雷桑创造了一种“地牢”错觉,进一步详细说明了大脑的分组机制。对面页面方框中右中部的灰色正方形,被黑色包围,看起来比左中部的灰色正方形(被白色包围)更暗。
这种效应可能是因为右侧的灰色元素看起来与白色背景位于同一平面,而不是地牢窗口的黑色横条。克里特大学感知研究员埃利亚斯·埃科诺穆的反向对比错觉也说明了这一点。灰色横条[参见对面页面方框右下角],即使它完全被黑色包围,也显得更暗,显然是因为它是白色横条组的成员。
这些有趣的错觉有一个严肃的方面。它们表明,大脑不能仅仅通过比较两个相邻表面的亮度来计算我们感知的灰度级。相反,周围环境以非常复杂的方式发挥作用。大多数人没有意识到这个问题的难度,这证明了人类视觉系统的卓越成就。
大局
关于大脑如何计算黑色和白色的科学共识仍有待时日。目前的理论分为低级、中级和高级三类。基于编码局部对比度的神经空间滤波机制的低级理论,无法预测人们看到的灰色阴影。高级理论将表面灰色阴影的计算视为一种无意识的智力过程,其中自动考虑了照射表面光线的强度。这些过程可能在直觉上很吸引人,但既没有告诉我们在大脑中寻找什么,也没有告诉我们如何为机器人编程。中级理论将每个场景解析为多个参考框架,每个框架都包含自己的锚点。这些理论比高级理论更好地指定了黑色、白色和灰色阴影的计算操作,同时比低级理论更好地解释了人类对灰色表面的感知。
但是,在我们能够真正理解视觉的这一方面——或者为机器人编程以实现我们人类系统所做的事情之前——我们将需要更好地理解边界是如何处理的。人眼和机器人一样,从场景的二维图片开始。它如何确定图片的哪些区域应该组合在一起并分配一个共同的锚点?视觉科学家将继续提出假设并通过实验来检验它们。我们将逐步迫使视觉系统放弃其秘密。
解码人类视觉计算可能是构建能够看清事物的机器人的最佳方式。但更重要的是,它可能是掌握大脑如何工作的最佳方式。