功能性磁共振成像(fMRI)自十年前问世以来,引起了相当大的轰动。它在空间维度和时间尺度上比之前的脑部扫描技术更为精细,通过让我们最终能够观察大脑的工作,激发了极大的兴奋。成千上万的 fMRI 研究探索了大脑激活的广泛差异:青少年与成人、精神分裂症患者和正常思维、有同情心和冷漠的人。研究人员使用 fMRI 对面部和单词识别、工作记忆和虚假记忆、人们预期疼痛、母亲识别自己的孩子、公民思考伦理困境——更不用说为什么许多消费者购买可口可乐,即使他们真的更喜欢百事可乐的味道——得出了大胆的结论。心理学家赞扬 fMRI 最终使他们的科学更加量化。认知神经科学家在最近对大脑理解的巨大扩展中大量引用了扫描结果。
然而,越来越多的争论开始围绕 fMRI 结果的可靠性展开。这场争论既具有技术性又具有哲学性,既关乎 fMRI 的准确性(因为它通过检测相关的血流量增加来间接测量神经元活动),也关乎其将复杂心理功能与特定大脑区域联系起来的合理性。批评者认为,fMRI 忽视了大脑运作的网络化或分布式性质,强调局部活动,而区域之间的沟通对于心理功能至关重要。
“这是一种非常粗略的技术,”德雷克大学心理学系主任史蒂文·福克斯批评道。“它就像一张模糊的照片——比没有照片好,但仍然模糊,存在经常被忽视的真正局限性。很容易过度夸大这项技术的价值。”
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
许多 fMRI 从业者似乎对这种强大的新工具引发争议感到困惑。“这个问题变得如此之大,让我感到非常惊讶,”华盛顿大学神经病学家马库斯·E·雷克尔说道,他研究脑部扫描已有二十多年。
模糊的精确度
脑部成像始于 20 世纪早期的一种称为脑 пневмоencephalography 的方法,这是一种危险的手术,其中颅骨的脑脊液被空气取代,以便在 X 射线下更清晰地显示大脑。血管造影术于 20 世纪 20 年代开发,通过捕捉注入血液的染料图像,产生了改进的结果。(血管造影术仍然用于帮助诊断和追踪血管缺陷和一些肿瘤。)这些早期方法仅显示静态结构而不是功能。计算机轴向断层扫描(CAT 或 CT)扫描于 20 世纪 70 年代开发,利用 X 射线技术并拍摄静态图片,但细节要丰富得多。
20 世纪 70 年代也带来了第一项功能成像技术——旨在不仅显示大脑结构,还显示大脑如何运作的扫描。正电子发射断层扫描 (PET) 测量与神经元活动相关的血流量增加,从而了解哪些神经元可能正在处理信息。受试者被注射放射性元素,这些元素标记葡萄糖等分子,这些分子通过血液输送到大脑。这些标记物发射正电子,并揭示细胞消耗葡萄糖的相对速率,这是心理过程期间哪些细胞活跃的标志。扫描结果引人入胜,但存在许多缺点。受试者担心摄入放射性物质;扫描过程需要将近一个小时;图像提供的时间分辨率相当宽泛,为 60 秒(意味着测量一个区域的血流量需要这么长时间),空间分辨率为 6 到 9 立方毫米——对于细致入微地理解正在发生的事情来说太大了。
相比之下,fMRI 可以在不到两秒钟内扫描大脑横截面,使其能够在 1 到 2 分钟内对大部分大脑进行建模。它可以以精细到 2 到 3 立方毫米的空间分辨率工作,但在实践中,它通常以体素(一个将“体积”与“像素”合并的术语)收集信息,体素大约为 2 毫米见方,4 到 5 毫米长,大约相当于一粒米的大小。FMRI 不需要注射,允许更广泛的扫描。在一项典型的研究中,受试者躺在甜甜圈状的机器中,首先闭上眼睛进行静息扫描,以提供基线读数。然后,在执行某些心理任务时再次扫描他:识别面孔、穿过计算机迷宫、参与角色扮演游戏。在最常用的技术中,称为 BOLD(血氧水平依赖)fMRI,机器通过发现当血液激增提高新鲜的含氧血红蛋白与“使用过的”脱氧血红蛋白(其电荷明显不同)的比率时发生的磁性变化来测量血流量的增加。产生激增的区域在图像上显示为更亮的颜色,红色随着流量增加而变为黄色。关于这些增加是否与实际神经元活动相对应的疑问已通过几项研究得到解答,这些研究将血流量直接与神经元信号传递联系起来,包括最近的动物模型,这些模型使用探针将单个神经元的放电与 fMRI 扫描中看到的血流量增加相匹配。
然而,这种联系显然是粗略的。达特茅斯学院心理学家阿比盖尔·A·贝尔德使用 fMRI 研究青春期大脑变化,她简洁地总结道:“血流动力学反应是一件马虎的事情。”首先,神经元活动发生在毫秒级,而血液激增则在 2 到 6 秒后发生;因此,检测到的血流量增加可能“供给”不止一个操作。此外,由于每个体素包含数千个神经元,因此可能需要数千甚至数百万个神经元放电才能显着照亮一个区域;这就像体育场的整个区域都必须喊叫才能被听到一样。
与此同时,在某些情况下,一小群神经元吸取的血液很少,或者连接大区域的稀疏神经元网络,可能执行与其他地方较大群体一样重要的功能,但要么未被检测到,要么显示为轻微活动。同样,一些神经元可能比其他神经元更有效地运作,消耗更少的血液。所有这些因素可能意味着 fMRI 图像错误地表示了实际的神经动力学。
处理扫描的千兆字节原始数据以使其成为图像引入了其他注意事项。研究人员必须在许多不同的算法之间进行选择和调整,以提取准确的图像,并在此过程中补偿颅骨和大脑配置的变化、受试者在扫描仪中的运动、数据中的噪声等等。正如最近的《自然神经科学》杂志文章所称,这种“推论链”为错误提供了很多机会。
最后,大多数 fMRI 研究使用单变量处理,批评者说这低估了神经动力学的分布式性质。指责声越来越高,因为单变量(字面意思是“一个变量”)算法将扫描期间来自每个体素的数据视为一个总和,这使得不可能知道特定体素中的活动是如何累积的(例如,一次性累积,还是分多次脉冲累积)或它如何与其他体素中的活动按顺序相关。单变量处理确实看到了所有部件都在工作——因此大多数图像中都亮起了多个区域——但没有以显示一个区域如何跟随或响应另一个区域的方式显示。这种情况使得观看 fMRI 图像有点像听弦乐四重奏,但只听到(在音乐结束后浓缩成一个单一噪音)每种乐器在该乐曲中产生的总音量,而不是听到演奏者如何相互伴奏和回应。称为多变量分析的统计方法可以分解每个体素的活动并分析大脑区域之间的相互作用,但这些分析的复杂性迄今为止限制了它们的使用。
显而易见和不太明显
对于某些人来说,这些模糊性和局限性使 fMRI 成为一种过于粗略的工具,无法用于正在进行的更具雄心的工作。“fMRI 产生的精美图形暗示了比实际情况更高的精度,”德雷克大学的福克斯说。“这确实是一种非常粗略的,如果不是模糊的,生理测量,人们正在使用它来试图确定一些非常复杂的行为。在太多的研究中,作者过度解读了数据。这些都无助于科学进步。”
雷克尔说,这种谴责是因为从业者偶尔不当使用而贬低了一种非常宝贵的工具。“我们必须记住我们正在研究大脑,”雷克尔说,“我们对大脑知之甚少。成像让我们能够探测它以产生新的假设。有些探测在回顾时看起来很愚蠢。但其中大部分是非常有成效的。”
愚蠢的追求并不难找到。例如,考虑一项研究表明,当男性观看法拉利时,他们的杏仁核(在产生情绪中起关键作用)会亮起来。正如福克斯所说,其他研究鲁莽地过度解读:一项关于民主党人和共和党人观看约翰·克里和乔治·W·布什视频的研究得出结论,当受试者观看反对派候选人时,他们对情绪敏感的杏仁核的活动增强“表明志愿者正在积极尝试不喜欢反对派。”然而,其他研究存在重大设计缺陷,例如 30 多项声称在被诊断患有 ADHD 的儿童中发现 ADHD 生理标记的研究——但未能控制受试者利他林使用的影响。
达特茅斯的贝尔德说,这样的工作并没有证明 fMRI 存在任何致命缺陷,而是突出了使用谨慎技术、可靠的研究设计和明智解释的重要性。贝尔德喜欢将她的 fMRI 研究与其他使用其他方法的类似研究进行对比,她将 fMRI 解释比作分析事故现场的刹车痕迹:“一个经常这样做、谨慎并且收集了大量其他证据的人可能会得出有用的结论。一个没有经验或不检查整个现场的人可能会读错它们。”
即使是严肃、精心设计的研究也可能因微妙的设计缺陷而被破坏。例如,在哈佛医学院麦克莱恩医院的黛博拉·尤尔格伦-托德进行的一项被广泛引用和宣传的青少年情绪反应性研究中,她扫描了青少年,让他们描述黑白照片中呈现的充满恐惧感的中年面孔的表情。与成人相比,观看图像的青少年在前额叶(大部分分析和判断发生的地方)表现出较少的活动,而在杏仁核中表现出更多的活动。青少年在描述表情方面也得分很低。尤尔格伦-托德告诉 PBS 的前线,结果表明“青少年的大脑可能更多地以本能反应而不是执行或思考类型的反应来回应。”但在后续研究中,贝尔德进行了一项类似的实验,使用彩色青少年面孔照片,发现青少年受试者的反应和得分与成人非常相似。“他们只是对更现代的彩色照片更感兴趣,”贝尔德说。“如果他们关心,他们就会做得很好。”
这个故事突出了 fMRI 最令人烦恼的一些非技术性难题:设计缺陷会破坏结果的危险性和容易性;尽管存在这些缺陷,图像的力量仍然可以影响专业人士、媒体和公众;以及结果如何强化传统观念,例如关于青少年思维和行为的观念。最后一个问题激起了对 fMRI 最重要的批评。包括福克斯和密歇根大学安娜堡分校心理学荣誉退休教授威廉·R·乌塔尔在内的一些批评者认为,fMRI 工作中研究的许多认知功能是如此抽象和模糊,以至于它们几乎没有比概念性神经系统更多的意义。在福克斯的清单中,最重要的是大脑所谓的执行功能。“那是真正的最爱,”他说,“测量中央执行官。现在——那是什么?”
许多精神科医生和神经科医生都认为执行功能是一种真实的能力,成像和物理研究表明它源于前额叶皮层和前扣带回皮层(位于两个额叶之间的一个小位置)中的区域网络。执行功能组织思想,并赋予人们计划和执行决议的能力。但大脑专家对执行功能在 fMRI 测试中被引用的频率表示怀疑;涉及的区域经常亮起。太多的研究人员可能过于轻率地得出结论,认为执行功能是罪魁祸首,而其区域可能只是亮起,因为执行功能是如此多大脑活动的基础,以至于它可能几乎总是“开启”的。
在某种程度上,福克斯和乌塔尔等批评者正在抗议必然抽象的术语的任意性质;他们正在质疑关于看不见的事物的现实性的判断性呼吁。扫描只是一种活动表现。但 fMRI 的支持者反驳说,当物理学家和天文学家描述根本看不见但从数据中推断出来的遥远宇宙物体时,每个人似乎都接受了。亚原子粒子的最终组成部分也是如此。“你无法直接看到或测量亚原子粒子,”达特茅斯 fMRI 数据中心运营主管约翰·达雷尔·范·霍恩指出。“但它们是我们可以根据实验进行改进的有用、得到充分支持的模型。我认为许多这些功能非常相似。”然而,正如范·霍恩指出的那样,中央执行官的概念对包括他在内的许多人来说都突破了极限;他认为它更像是一个隐喻,而不是一个模型。将需要进一步的证据来解决这些模糊的命名问题。
更广阔的视野
fMRI 争议同时涉及概念性和有形事物并非偶然。这种二元性是科学家试图将短暂的思维与有形的大脑联系起来时固有的。一个基本问题是,fMRI 是将特定心理过程与特定大脑区域联系起来的旧诱惑的新变体。
很少有研究人员认真地认为大脑功能如此分隔。正如雷克尔所说,“没有哪个理性的人会认为存在一个单一的‘情感’点,例如。”然而,大多数 fMRI 研究确实侧重于给定的心理过程如何激活某些区域。这引起了尖锐的指责,即 fMRI 研究构成了“新的颅相学”,是 19 世纪实践的现代版本,该实践将一个人头骨上的凸起解释为他的智力和性格地图。乌塔尔写了一整本书来探讨这个主题[参见下面的“延伸阅读”]。
这种指责可能言过其实。大多数 fMRI 研究人员寻求的不是定位大脑功能,而是绘制系统各部分的地图,这些部分在不同任务中以不同的组合发挥作用。尽管这种方法本身可能暗示了一种定位思维模式,但这可能仅仅是因为 fMRI 作为一种技术仍然很年轻,并且正在被用作未来更复杂绘图的首次调查工具;自然而然地,先绘制简单的城市地图,然后再描绘连接它们的复杂道路系统。即使与仅仅三年前的研究相比,今天的 fMRI 研究也更频繁地识别和讨论几个活跃大脑区域之间的关系。有一天,fMRI 可能会显示大脑的真实本质,雷克尔说,大脑“就像一个管弦乐队”,不同的部分在不同的时间、音量和音色演奏,具体取决于所需的效果,以无尽的组合相互作用,创造出无限多样的音乐。
下一步是什么?
为了更充分地听到这种音乐,当前的 fMRI 技术必须进步。一个关键是改进可以跟踪大脑区域之间相互作用的多变量算法。普林斯顿大学的詹姆斯·V·哈克比、麻省理工学院的大卫·考克斯、瑞士日内瓦大学的莫娜·斯皮里顿和哥伦比亚大学的克里斯蒂安·哈贝克等研究人员已成功使用多变量处理来揭示大脑区域之间的相互作用。考克斯发现,志愿者观看不同物体产生的模式非常独特,以至于他可以很快学会检查受试者的一系列扫描结果,并正确猜测该人一直在观看哪个物体。扩展和改进此类多变量协议应该让 fMRI 揭示更多关于大脑区域如何协同工作的信息。
这些改进是否会结束关于 fMRI 和其他脑部成像的争议?也许部分会。更标准化的处理协议和同行评审应该会减少方法上的错误。进步很可能会克服技术问题;研究人员已经在努力将 fMRI 的空间敏锐度与脑电图和脑磁图更严格的时间分辨率相结合,脑电图和脑磁图分别通过检测神经元产生的微小电活动和磁活动来测量神经元活动。这些创新以及其他尚未预见的创新,有一天应该能够以更高的空间和时间精度测量神经元活动。
这些进步可能无法解决脑部成像引起的哲学焦虑。试图确定意识的神经相关性激起了长期以来的坚持,勒内·笛卡尔首次充分阐明了这一坚持,即我们的思维不仅仅是我们的头脑。我们抵制“思维是肉”的观念,正如小说家乔纳森·弗兰岑在思考他父亲的阿尔茨海默病时所说的那样。大多数人对自己的想法和感受——似乎是他们自己的性格和身份——被简化为神经元活动的像素化图片感到不舒服。
随着技术使两者更容易结合,这种形而上学的不安可能只会增长。或者也许我们会克服它。正如著名的爱荷华大学神经科学家安东尼奥·R·达马西奥所指出的那样,他称这种抵抗为“笛卡尔的错误”,他认为我们最终可能会将思想和情感的复杂性与我们的神经元联系起来,而不会有任何失落感。
(作者)
大卫·多布斯是珊瑚礁疯狂:查尔斯·达尔文、亚历山大·阿加西斯和珊瑚的意义的作者,该书最近由万神殿出版社出版。他的作品可以在 www.daviddobbs.net 上找到
(延伸阅读)
神经元耗氧量的量化观察。约翰·E·W·梅休,刊登于《科学》杂志,第 299 卷,第 1023-1024 页;2003 年 2 月 14 日。
新颅相学。威廉·R·乌塔尔。麻省理工学院出版社,2003 年。
解读 BOLD 信号。尼科斯·K·洛戈塞蒂斯和布莱恩·A·万德尔,刊登于《生理学年度评论》杂志,第 66 卷,第 735-769 页;2004 年 3 月。