大脑的面孔代码如何解开感知的奥秘

多丽丝·曹掌握了大脑中的面部识别。现在她正在研究确定我们所看到的一切的神经代码

多丽丝·曹的职业生涯始于解读面孔——但在九月的几个星期里,她努力控制自己脸上的表情。曹刚刚获得了麦克阿瑟基金会“天才”奖,这项荣誉附带超过五十万美元的奖金,获奖者可以随意使用。但她发誓要保密——即使基金会派了一个摄制组到她在帕萨迪纳加州理工学院(加州理工学院)的实验室。她既兴奋又尴尬,不得不编造一个解释,同时还要控制住自己的表情。

正是她在面孔研究方面的工作为曹赢得了奖项和赞誉。去年,她破解了大脑用来识别面孔的代码,这些面孔来自形状、特征之间的距离、色调和纹理等无数微小的差异。编码的简洁性让神经科学界感到惊讶和印象深刻。

伦敦大学学院的塞恩斯伯里惠康神经回路与行为中心主任汤姆·姆尔西奇-弗洛格尔说:“她的工作具有变革意义。”


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和思想的具有影响力的故事能够拥有未来。


但曹不想仅仅被人们记住是发现面孔代码的科学家。她说,这只是一种手段,是解决她真正感兴趣的问题的好工具:大脑如何通过填补感知中的空白来构建一个完整、连贯的世界模型?她说:“这个想法有一个优雅的数学公式”,但一直很难付诸实践。曹现在有了一个如何开始的想法。

对于神经科学家玛格丽特·利文斯通来说,曹有雄心壮志解开一些最棘手的思维奥秘并不奇怪,利文斯通在曹于马萨诸塞州波士顿的哈佛医学院攻读博士学位期间一直指导她。“多丽丝从不跑题,”她回忆说。“她安静而专注,总是追求大问题。”

曹在一个充满科学的家庭中长大。她的母亲是一名计算机程序员,她的父亲是一名机器视觉研究员。当曹只有四岁时,他们从中国常州移民到美国,“为了过上更好的生活,拥有更多机会”,她说。

曹说:“我父亲可能是我研究视觉的关键原因,尽管我试图否认这一点。”早在她上高中的时候,他们就讨论了大脑如何处理视觉方面的数学理论。她说,她发现这些理论“非常优美”。“他帮助在我脑海中种下了视觉需要深刻解释的想法。”

她在加州理工学院毕业,获得了数学和生物学学位,然后在 1996 年加入了利文斯通的团队,最初研究大脑感知视觉深度的方式。

面孔代码

利文斯通的实验室与猕猴合作,猕猴具有与人类相似的视觉系统和大脑组织。任何灵长类动物眼睛看到的世界景象都会从视网膜汇入视觉皮层,视觉皮层的各个层会对传入的信息进行初步处理。起初,它只不过是深色或浅色像素,但在 100 毫秒内,信息会迅速穿过大脑区域网络进行进一步处理,从而生成一个有意识地识别的 3D 景观,其中有许多物体在其中移动。

在攻读博士学位的大部分时间里,曹都专注于视觉皮层的最外层,视网膜的信息首先到达那里。她学会了如何将微小的电极——灵敏到足以记录单个脑细胞的放电——插入猴子大脑的这个区域。但为了帮助她更深入地探究视觉皮层,她决定将脑成像添加到她的研究方法中。功能性磁共振成像 (fMRI) 提供的更广泛的大脑激活图谱可以帮助指导更精确的单细胞记录技术。当时,很少有实验室对动物的大脑进行成像,但比利时鲁汶天主教大学的猴子 fMRI 先驱维姆·范杜菲尔帮助曹建立了在波士顿开展这项工作所需的基础设施。

在学习这项技术的过程中,她注意到附近麻省理工学院的神经科学家南希·坎维什做出了一项令人惊讶的 fMRI 发现。坎维什已经确定了人类大脑中的一个小区域,当一个人看到面孔图片时,该区域会亮起,但当他们看到房屋或勺子等其他物体的图片时,该区域不会亮起。

曹推断,如果猴子身上也存在相同的面部识别系统,她就可以使用她灵敏的电极来探测涉及的神经元,并弄清它们是如何运作的。

她与当时在坎维什实验室担任博士后的温里奇·弗赖瓦尔德合作,开始了一系列实验,将 fMRI 与单细胞记录技术相结合,以探测下颞 (IT) 皮层,即坎维什已确定的脑区。在接下来的八年左右的时间里,弗赖瓦尔德、曹及其合作者取得了一系列重要发现。在猕猴面前一张接一张地展示图片,他们绘制出了对人类或猴子面孔做出反应的单个细胞。这使他们能够识别出大脑每侧的六个斑块,这些斑块沿着 IT 皮层分布。如果研究人员对任何一个斑块进行电刺激,其他斑块也会亮起。弗赖瓦尔德说,第一次看到这些面部斑块在一个网络中协同工作“是一个快乐的时刻”,他现在在纽约市的洛克菲勒大学工作。

弗赖瓦尔德和曹还发现,这些斑块往往是专门化的。通过向猴子展示一系列卡通面孔,这些面孔缺少头发、鼻子或虹膜等各种细节,他们可以确定哪些细胞对特定的面部特征做出反应。细胞的放电率会根据特征的极端程度而上升,这种特性被称为斜坡形调谐,事实证明,斜坡形调谐是面部编码的基础。例如,一个对两眼之间距离做出反应的细胞,可能对近距离的眼睛放电缓慢,但对距离较远的眼睛放电迅速。当他们向猴子展示看向不同方向的真实面孔时,研究人员发现,最靠近视觉皮层的斑块中的细胞倾向于对任何面孔的特定方向做出反应,而最深处的斑块中的细胞则对少数几个特定的面孔做出反应,无论其方向如何。

为了研究 IT 皮层如何从这些信息中编码完整的面孔,曹意识到,每个面孔都可以通过混合“面孔性”的最重要维度来创建,例如鼻子有多尖、眼睛的间距或肤色。她和她的博士后史蒂文·李·张确定了面孔之间变化最大的 50 个维度——形状 25 个,外观 25 个——并创建了一组 2,000 张面孔图像,其中所有 50 个维度的值都是已知的。当他们测量两个面部斑块中 205 个神经元的反应时,他们向猴子闪烁这些图像。代码开始显现出来。

更表层的斑块中的细胞倾向于针对形状维度进行调谐,而位于 IT 皮层更深处的许多细胞则对外观维度做出反应。这是有道理的,因为当头部转动时,更深层的细胞可能必须考虑扭曲的形状维度。曹和张可以根据任何面孔的维度来预测神经元将如何放电,他们甚至可以仅从这些细胞的放电模式中重建面孔(参见“解码面孔”)。

这项研究似乎指向了一种机制,通过这种机制,皮层中的单个细胞解释越来越复杂的视觉信息,直到在最深处,单个细胞编码特定的人。

这个想法在直觉上很有道理。2005 年,当时在加州理工学院担任博士后的罗德里戈·奎安·基罗加发现了后来被称为詹妮弗·安妮斯顿细胞的东西。通过与大脑中植入了电极以治疗癫痫发作的人合作,奎安·基罗加发现了来自单个神经元的信号,这些神经元对熟悉或著名人物的照片做出反应。这些细胞也对那个人的任何概念做出反应。例如,一个神经元对演员詹妮弗·安妮斯顿的照片做出反应,但也对她的书面名字甚至她主演的电影的标题做出反应。这些“概念”细胞位于海马体中,海马体比 IT 皮层更深一点。

2015 年,曹在瑞士阿斯科纳的一个小型会议上遇到了现在在英国莱斯特大学工作的奎安·基罗加,她在会上展示了她的最新成果。晚饭后,他问她,她认为她的面部细胞与他的概念细胞有何关系。“它们可能是它们的前身,”她告诉他。但她整晚都在为自己的回答而烦恼。有一件事一直困扰着她。她一直在研究的深层 IT 皮层细胞经常对几个不同的面孔做出反应——那些看起来根本不像的面孔。

那天晚上无法入睡,她仔细思考了她和张一直在应用到他们数据中的数学分析。然后,顿悟的时刻来临了。她已经无数次地研究过如此简洁地描述细胞斜坡形调谐反应的数学。但在黑暗、寂静的酒店房间里,她意识到这与描述一种投影的数学运算相同。例如,投影解释了太阳如何根据两个不同物体的位置投射相同的阴影。她说,如果细胞只是从多维“面孔空间”中投影组合维度,“这将解释为什么许多不同的面孔可以在一个面部细胞中引起相同的反应”。IT 皮层根本不是在追踪某一个特定的人;这种转变一定发生在大脑中更深处。

一个分类变化

早餐时,她告诉奎安·基罗加她新的预感,发现他也在考虑同样的事情。因此,她打了一个不同寻常的赌:她和他打赌一瓶昂贵的葡萄酒,赌它是错的,“因为如果它是真的,即使没有葡萄酒我也会很高兴”。

她和张匆匆赶回实验室,开始了额外的实验,结果她输掉了这瓶酒,但也最终在 2017 年发表了面部识别代码。

曹说,这个代码令人兴奋地——也许只是一点点令人失望地——简单。她说,这个认识“是我最快乐的时刻之一”。

很有可能相同的简单代码可能适用于整个 IT 皮层。科学家们发现了其他类似于面部斑块网络的网络,这些网络对其他事物做出反应,包括身体、场景和彩色物体。但 IT 皮层的大部分区域仍是未知的领域。在今年夏天在柏林举行的一次神经科学会议上,曹介绍了她目前工作的一些细节。她和她的博士后包平磊一起,对她称之为 IT 皮层无人区的细胞进行了电刺激,同时扫描了猴子的大脑。两个斑块亮了起来,表明存在另一个网络——但这一次她不知道它的功能。

为了弄清楚,她用她的记录电极瞄准了这些斑块,并监测了神经元活动,当时一只猴子观看了 50 个随机选择的物体的图片——从动物和车辆到蔬菜和房屋——每个物体来自 24 个不同的角度。神经元不对面孔做出反应,但放电活动的模式也没有表明任何其他特定类别的物体与该网络有关。相反,神经元似乎编码了不同物体的通用属性。例如,它们似乎记录了某物是像相机三脚架那样尖锐,还是像 USB 棒那样粗短;像猫一样有生命,还是像房子一样无生命。

这个网络处理信息的方式与面部斑块网络处理面孔的方式有着惊人的相似之处。单个细胞对形状或特征元素做出反应,并具有斜坡形调谐。例如,一个针对物体的生命力进行调谐的细胞,可能对洗衣机放电缓慢,而对猫放电迅速。更表层的斑块中的细胞倾向于对相似方向的相似类别的物体做出反应,而 IT 皮层最深处的斑块中的细胞倾向于对少数几个特定物体做出反应,无论角度如何。曹和包能够通过查看仅约 400 个左右神经元的放电模式来正确预测任何物体的外观。

曹说:“我们认为整个 IT 皮层可能都使用相同的组织结构,即连接斑块的网络,以及用于所有类型物体识别的相同代码。”

瑞士巴塞尔弗里德里希·米歇尔生物医学研究所的神经科学家格奥尔格·凯勒对此表示赞同。“这让人有希望,这种基于特征的编码可能在大脑中广泛运作,”他说。

产生幻觉的引擎

然而,现在,曹想解决更大的问题,即大脑如何捕捉世界的整体,而不仅仅是如何解码物体。这意味着不仅要理解流入大脑的视觉和其他感官信息是如何处理的,还要理解经验在大脑深处嵌入的高级知识是如何影响感知的。“想想我们如何知道湖面上一个模糊的斑点很可能是一只鸭子,”她说。

她说,大脑不仅仅是一系列被动地筛选出面孔、食物或鸭子的筛子,“而是一个产生幻觉的引擎,它基于当前对世界的最佳内部模型来生成一个现实版本”。她的想法借鉴了贝叶斯推理理论;她说,只有将感知与高级知识相结合,大脑才能对现实达成最佳理解。

一种可能的机制是一种长期争论的理论,称为预测处理,该理论目前正在神经科学家中引起兴趣。预测处理认为,大脑的运作方式是预测其周围环境将如何逐毫秒地变化,并将该预测与通过各种感官接收到的信息进行比较。它使用任何不匹配——“预测误差”——来更新其世界模型。

为了弄清楚发生了什么,曹想了解大脑产生幻觉的引擎是如何连接的。但由于不确定哪种方法最有效,她正在同时尝试几种方法,并从大脑更深层的部分进行记录。

她的方法之一包括探测视错觉,例如著名的面孔-花瓶图片。大脑在盯着它看几秒钟后会自动在两种感知之间切换。通过在猴子盯着图片看时记录单个神经元,曹试图确定切换发生在大脑中的哪个位置以及如何发生,以及它如何重置世界的内部表征。另一种方法包括向猴子展示一张熟悉的面孔的图片,然后将其变形为另一张熟悉的面孔,同时在大脑中进行记录。灵长类动物的大脑会自动尝试将面孔归类为熟悉的,并在一个精确的点切换其对它所看到的两个个体中哪一个的感知。“十年前,没有人会知道从哪里开始研究这些现象,因为我们不知道面孔——或花瓶——在大脑中的哪个位置被处理,”曹说。现在,位置和代码都已知,“我们可以询问关于感知发生变化时究竟发生了什么变化的问题”。

研究小鼠视觉皮层预测编码的凯勒说,在非人灵长类动物中使用这种方法“具有很大的潜力”。他说,小鼠对世界的内部模型有限,而且从小鼠身上获得的结果是否适用于人类尚不清楚。尽管他和其他人可以使用 fMRI 和脑电图来研究人类大脑中的预测编码,但这些技术只允许进行肤浅的检查。“我们无法像多丽丝那样深入了解人类的机制或它是如何实现的。”

曹继续深入大脑进行探索,以寻找她父亲在她年轻时启发她的那种优美的方程式。然而,她不再需要隐藏她的兴奋。现在,这种兴奋洋溢在她整个脸上。

本文经许可转载,并于 2018 年 12 月 11 日首次发表 《自然》 杂志。

© . All rights reserved.