关注错误:大脑如何监控错误并从失误中学习

脑科学家已经确定了神经细胞,这些细胞可以监控表现、检测错误并控制从不幸中学习的能力

1986年4月26日:在例行测试期间,切尔诺贝利核电站4号反应堆发生爆炸,引发了民用核能史上最严重的灾难。

2006年9月22日:在试运行中,实验性磁悬浮列车Transrapid 08在德国拉滕附近以每小时125英里的速度撞上一辆维修车,残骸散落数百码,造成23名乘客死亡,另有10人重伤。

人为错误是这两起事故的幕后原因。当然,人们每天都会犯错误,无论大小,监控和纠正失误是日常生活的一部分。虽然人们可以理解地希望避免严重的错误,但大多数失误都有好的一面:它们为大脑提供了关于如何改进或微调行为的信息。事实上,从错误中学习可能对我们物种的生存至关重要。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


近年来,研究人员已经确定了大脑中一个称为内侧前额叶皮层的区域,该区域在检测错误和对错误做出反应方面起着核心作用。每当人们或猴子在因错误而产生的负面反馈或奖励减少后改变其行为时,这些额叶神经元就会变得活跃。

最新的研究表明,我们从失误中学习的大部分能力源于神经递质多巴胺的作用。事实上,影响多巴胺信号传递的基因变异可能有助于解释人与人之间从过去的失误中学习程度的差异。与此同时,某些脑部活动模式通常预示着错误,从而为使用便携式设备预防容易出错的脑部状态开辟了可能性,这些设备可以检测容易出错的脑部状态。

错误检测器
大脑错误检测装置的线索在 1990 年代初期意外出现。德国多特蒙德大学的心理学家迈克尔·法尔肯斯坦及其同事在使用脑电图 (EEG) 监测受试者大脑进行心理学实验时,注意到每当受试者按下错误的按钮时,额叶的电位突然下降约 10 微伏。伊利诺伊大学的心理学家威廉·J·格林及其同事证实了这种效应,研究人员将其称为错误相关负性,或 ERN。

ERN 可能出现在各种类型的错误、不利结果或冲突情况下。当一个人的行为产生意想不到的结果时,就会发生行动错误。例如,时间压力通常会导致打字时的拼写错误或电子邮件上的错误地址。行动错误发生后,ERN 会迅速出现,并在不正确的肌肉活动结束后 100 毫秒内达到峰值。

一种稍晚出现的 ERN,在结果发生后 250 到 300 毫秒达到峰值,发生在对不利反馈或金钱损失的反应中。这种所谓的反馈 ERN 也可能出现在一个人面临艰难选择(称为决策不确定性)并且即使在做出选择后仍然感到冲突的情况下。例如,一个人在超市选择了一条结账队伍,然后意识到这条队伍比邻近的队伍移动得更慢,这时可能会出现反馈 ERN。

ERN 起源于大脑的哪个部位?研究人员使用功能性磁共振成像以及其他成像方法反复发现,错误识别发生在内侧前额叶皮层,即大脑表面额叶中间的区域,包括前扣带回。此类研究表明,该大脑区域是负面反馈、行动错误和决策不确定性的监控器——因此也是人类表现的总体主管。

在 2005 年的一篇论文中,我与英国南安普顿听力研究所的心理学家斯特凡·德贝纳和我们的同事一起表明,内侧前额叶皮层可能是 ERN 的可能来源。在这项研究中,受试者执行了一项所谓的侧翼任务,在该任务中,他们在周围的诱饵箭头中指定了中心目标箭头的方向,同时我们使用 EEG 和 fMRI 同时监测他们的大脑活动。我们发现,一旦 ERN 出现,内侧前额叶皮层的活动就会增加,并且 ERN 越大,fMRI 信号越强,这表明该大脑区域确实产生了经典的错误信号。

从失误中学习
除了识别错误之外,大脑还必须有一种适应性地响应错误的方式。在 1970 年代,英国曼彻斯特大学的心理学家帕特里克·拉比特是第一个系统地研究此类反应的人之一,他观察到,与正确的击键相比,打字错误击键的键盘压力略小,就好像打字员试图在最后一刻退缩一样。

更普遍的是,人们经常通过在犯错后减速来对错误做出反应,这大概是为了更仔细地分析问题并切换到不同的策略来处理任务。这种行为变化代表了我们从错误中学习的方式,希望避免将来发生类似的失误。

内侧前额叶皮层似乎也控制着这个过程。成像研究表明,例如,在一个人因行动错误而减速之前,该区域的神经活动会增加。此外,研究人员在猴子的内侧前额叶皮层中的单个神经元中发现了反应,这些神经元与动物对负面反馈的行为反应有关,类似于错误产生的负面反馈。

1998 年,日本仙台东北大学医学院的神经科学家岛桂雪和丹治淳训练了三只猴子,让它们根据视觉信号推或转动手柄。猴子会根据它期望的奖励来选择它的反应:例如,如果推动手柄一直伴随着奖励,它就会推手柄。但是,当研究人员连续减少推动的奖励时——一种负面反馈或错误信号——动物会在几次试验后切换为转动手柄。与此同时,研究人员正在记录猴子扣带回部分单个神经元的电活动。

岛和丹治发现,有四种类型的神经元在奖励减少后改变了它们的活动,但这仅当猴子将这种减少用作推动而不是转动,或反之亦然的线索时才会发生。如果猴子没有决定切换动作,或者它是为了响应音调而不是较少的奖励而切换动作,这些神经元就不会退缩。当研究人员暂时停用该区域的神经元时,猴子在奖励减少后不再切换动作。因此,这些神经元为了改变行为而传递有关奖励程度的信息,并且可以将负面反馈用作改进的指南。

2004 年,马萨诸塞州总医院的神经外科医生齐夫·M·威廉姆斯及其同事报告说,他们在人类前扣带回中发现了一组具有相似特性的神经元。研究人员从五名安排在该大脑区域进行手术切除的患者身上记录了这些神经元。当这些神经元被接通时,患者完成了一项任务,在该任务中,他们必须根据视觉提示选择两个方向之一来移动操纵杆,该视觉提示还指定了金钱奖励:九美分或 15 美分。在九美分的试验中,参与者应该改变他们移动操纵杆的方向。

与猴子神经元的反应类似,当前扣带回神经元的活动在提示表明奖励减少以及运动方向改变时升至最高水平。此外,神经元活动的水平预测了一个人是会按照指示行动还是会犯错。在手术切除这些细胞后,当提示患者面对报酬减少时改变他们的行为时,他们犯了更多错误。因此,这些神经元似乎将有关奖励的信息与行为联系起来。在检测到实际结果与期望结果之间的差异后,这些细胞会确定优化奖励所需的纠正措施。

但是,除非被指示这样做,否则动物通常不会在仅仅一次事故后就改变它们的行为。相反,它们仅在多次失败尝试的模式之后才会改变策略。前扣带回似乎也以这种更实际的方式工作,以仲裁对错误的反应。在 2006 年的一项研究中,实验心理学家斯蒂芬·肯纳利和马修·拉什沃斯及其牛津大学的同事教会了恒河猴拉动杠杆以获得食物。经过 25 次试验后,研究人员改变了规则,当猴子转动杠杆而不是拉动杠杆时,就会分配食物。猴子适应并切换为转动杠杆。过了一段时间,研究人员再次更改了规则,猴子再次更改了它们的行为。

每次猴子都没有立即切换动作,而是在几次虚假启动后才切换动作,使用前四到五次试验作为指导。然而,在扣带前回受到损伤后,动物失去了这种长期视角,而是仅使用它们最近的成功或失败作为指导。因此,前扣带回似乎控制着动物评估一段短暂的命中和未命中历史作为未来决策指南的能力。

化学激励
这种评估可能取决于多巴胺,多巴胺在大脑中传递成功信号。剑桥大学的神经生理学家沃尔夫拉姆·舒尔茨及其同事在过去 15 年中表明,当奖励大于或小于预期时,产生多巴胺的神经细胞会改变它们的活动。例如,当猴子因正确的反应而意外获得奖励时,细胞会变得兴奋,释放多巴胺,而当猴子在犯错后未能获得食物时,它们的活动就会下降。如果多巴胺的数量稳定地改变了神经细胞之间的连接,那么它的差异释放可能会促进从成功和失败中学习。

事实上,多巴胺水平的变化可能有助于解释我们如何从积极和消极强化中学习。多巴胺会激发大脑所谓的“去”通路,该通路促进反应,同时还会抑制抑制行动的“不去”通路。因此,积极强化产生的多巴胺爆发通过激活“去”通道和阻断“不去”通道来促进学习。相反,消极结果后多巴胺的下降应该通过使“去”通路失活,同时释放对“不去”通路的抑制来促进回避行为。

2004 年,当时在科罗拉多大学博尔德分校的心理学家迈克尔·J·弗兰克及其同事报告了多巴胺对学习影响的证据,这项研究针对的是患有帕金森病(神经递质产生过少)的患者。弗兰克推测,帕金森病患者可能难以产生从积极反馈中学习所需的多巴胺,但他们低水平的多巴胺可能有助于基于负面反馈的训练。

在该研究中,研究人员在计算机屏幕上显示成对的符号,并要求 19 名健康人和 30 名帕金森病患者从每对符号中选择一个符号。每当受试者选择了任意正确的符号时,就会出现“正确”字样,而每次“错误”选择后都会闪烁“不正确”字样。(没有符号总是正确或不正确。)其中一个符号被认为是正确的概率为 80%,另一个符号的概率为 20%。对于其他对,概率分别为 70:30 和 60:40。受试者应该从这种反馈中学习,从而增加稍后测试运行中正确选择的数量。

正如预期的那样,健康人在偏好正确符号和避免不正确符号方面的能力大致相同。另一方面,帕金森病患者表现出更强的拒绝负面符号的倾向,而不是选择正面符号——也就是说,他们从错误中学习的比从成功中学习的更多,这表明多巴胺的缺乏确实以预期的方式偏向了他们的学习。此外,在患者服用提高大脑多巴胺水平的药物后,他们从积极反馈中学习的能力超过了从消极反馈中学习的能力,这突显了多巴胺在积极强化中的重要性。

学习能力中基于多巴胺的差异也出现在健康人群中。去年 12 月,我与心理学研究生蒂尔曼·A·克莱恩和我们的同事一起表明,这种差异部分是基于 D2 多巴胺受体基因的个体差异。这种基因的一种变体称为 A1,会导致神经细胞膜上这些受体的密度降低高达 30%。

我们要求 12 名携带 A1 变体的男性和 14 名拥有该基因更常见形式的男性执行一项类似于弗兰克使用的基于符号的学习测试。我们发现,与没有这种基因形式的参与者相比,A1 携带者记住和避免负面符号的能力较差。A1 携带者避免负面符号的频率也低于他们选择正面符号的频率。非携带者从好符号和坏符号中学习的效果大致相同。

因此,较少的 D2 受体可能会损害一个人从错误或负面结果中学习的能力。(这种分子怪癖只是影响这种学习的众多因素之一。)因此,我们的 fMRI 结果表明,A1 携带者的内侧前额叶皮层对错误的反应弱于其他人群,这表明该大脑区域是多巴胺对从负面反馈中学习产生影响的位点之一。

但是,如果较少的 D2 受体导致回避学习受损,那么为什么提高多巴胺信号传递的药物也会导致帕金森病患者出现此类损伤?在这两种情况下,多巴胺信号传递实际上都可能通过其他多巴胺受体增加;研究表明,A1 携带者产生异常大量的多巴胺,这可能是为了补偿他们缺乏 D2 受体。无论原因是什么,对不愉快后果的不敏感都可能导致 A1 携带者中的肥胖、强迫性赌博和成瘾的发生率略高于一般人群。

预测错误
虽然从错误中学习可能有助于我们避免未来的失误,但缺乏经验或注意力不集中仍然可能导致错误。然而,根据我的团队 4 月份发表在《美国国家科学院院刊》上的研究,许多此类失误被证明是可以预测的,并且脑代谢中预示性的变化预示了这些失误。

我与挪威卑尔根大学的认知神经科学家汤姆·艾谢勒和几位同事一起,要求 13 名年轻人执行一项侧翼任务,同时我们使用 fMRI 监测他们的大脑活动。从我们的受试者犯错前约 30 秒开始,我们发现两个大脑网络的激活发生了明显但渐进的变化。

其中一个网络称为默认模式区域,通常在人处于休息状态时更活跃,而在人从事任务时会安静下来。但在犯错之前,该网络的后部——包括位于大脑中心表面附近的后扣带皮层——变得更加活跃,表明大脑正在放松。与此同时,每当一个人努力工作时就会活跃起来的额叶区域的活动下降,这表明这个人也变得不太专注于手头的任务。

我们的结果表明,错误是大脑中逐渐变化的产物,而不是大脑活动中不可预测的闪烁。这种调整可以用来预测错误,特别是那些在单调的任务中发生的错误。未来,人们可能会佩戴便携式设备来监测这些大脑状态,作为预防最有可能发生且最重要的错误的第一步。

编者注:本文最初以“关注错误”为标题发表

(延伸阅读)

  • 内侧前额叶皮层在认知控制中的作用。K. 理查德·里德林克霍夫、马库斯·乌尔斯佩格、伊芙琳·A·克罗内和桑德·纽文豪斯,《科学》,第 306 卷,第 443-447 页;2004 年 10 月 15 日。

  • 胡萝卜加大棒:帕金森病中的认知强化学习。迈克尔·J·弗兰克、劳伦·C·西伯格和兰德尔·C·奥莱利,《科学》,第 306 卷,第 1940-1943 页;2004 年 12 月 10 日。

  • 人类前扣带回神经元和货币奖励与运动反应的整合。齐夫·M·威廉姆斯等,《自然神经科学》,第 7 卷,第 12 期,第 1370-1375 页;2004 年 12 月。

  • 错误监控的神经变化:最新发现和理论视角。S. F. 泰勒、E. R. 斯特恩和 W. J. 格林,《神经科学家》,第 13 卷,第 2 期,第 160-172 页;2007 年 4 月。

  • 从错误中学习的基因决定差异。蒂尔曼·A·克莱恩等,《科学》,第 318 卷,第 1642-1645 页;2007 年 12 月 7 日。

  • 事件相关脑网络中适应不良的变化对人类错误的预测。汤姆·艾谢勒等,《美国国家科学院院刊》,第 105 卷,第 15 期,第 6173-6178 页;2008 年 4 月 22 日。

SA Mind Vol 19 Issue 4本文最初以“关注错误”为标题发表于SA Mind 第 19 卷第 4 期(),第 52 页
doi:10.1038/scientificamericanmind0808-52
© . All rights reserved.