我们如何得知人类变得更聪明了[节选]

在这本新书的节选中，詹姆斯·R·弗林解释了他如何理解在 20 世纪我们的思维如何在认知技能方面有所提高

智商提高的现象由于概念上的混淆而引起了不必要的争议。想象一下，一位来自遥远未来的考古学家挖掘了我们的文明，并发现了随着时间的推移，在射击测试中的表现记录。测试始终相同，即一分钟内可以将多少颗子弹射入 100 米外的靶子。1865 年（美国内战）的记录显示，最高分是五颗子弹命中靶心，1898 年（美西战争）的记录显示为 10 颗，1918 年（第一次世界大战）的记录显示为 50 颗。

一群“射击计量学家”查看了这些数据。他们发现这些数据对于衡量射击技巧毫无价值。他们提出了两点。首先，他们区分了测量的手段和被测量的特质。仅仅因为测试中的“正确项目”数量有所增加，并不意味着射击能力有所提高。的确，测试没有改变，但我们只知道测试变得更容易了。许多事情都可能导致这种情况。其次，他们强调我们只有相对的测量尺度，没有绝对的测量尺度。我们可以对三个不同时间点的士兵进行相互排名。但是，我们没有办法将一个射击工具的过渡与另一个射击工具联系起来。你如何将使用投石器的最佳射手与使用弓箭的最佳射手进行排名？在这一点上，射击计量学家要么放弃，要么寻找一些可以让他完成工作的方法。也许是一些新的数据，可以提供随着时间推移的绝对射击技巧衡量标准，例如视力测试或衡量手稳度的指标。

关于支持科学新闻报道

如果您喜欢这篇文章，请考虑订阅我们的获奖新闻报道以示支持订阅。通过购买订阅，您正在帮助确保关于当今塑造我们世界的发现和想法的有影响力的故事的未来。

然而，一群军事历史学家也来了，他们此时感到兴奋。他们想知道为什么测试变得更容易了，无论答案是否帮助或破坏了随着时间推移衡量射击技巧的标准。他们要求考古学家进一步调查。幸运的是，他们发现了每个时期特有的战场。1865 年的战场揭示了原始步枪的存在，1898 年的战场揭示了连发步枪的存在，1918 年的战场揭示了机枪的存在。现在我们知道为什么随着时间的推移更容易将更多的子弹射入靶子，并且我们可以确认这并不是射击技巧增强的衡量标准。但这具有巨大的历史和社会意义。战斗伤亡、武装部队所需的工业等等都发生了巨大的变化。

关于这两个角色的困惑已经消除了。如果战场是最先发现的文物，那么就不会有困惑，因为没有人将战场用作衡量射击技巧的工具。正是因为第一批文物也是测量工具，才导致历史学家和计量学家之间目标不一致。现在他们看到，不同的概念主导着他们的两个领域：武器的社会进化——其意义在于我们在解决如何快速杀死人的问题方面变得更加擅长；射击技巧——其意义在于哪些人比其他人更有能力更熟练地杀人。

历史学家并没有破坏计量学家所做的工作。在任何给定的时间，衡量射击技巧可能是你能做的最重要的事情，以预测个人的生活经历。想象一个以决斗为主导的社会。那些射击水平不高的人的寿命可能太短，不值得浪费时间送他们去大学，或者雇用他们，或者娶他们。如果某个特定的群体或国家缺乏这项技能，他们可能会任由技术更高的人摆布。尽管如此，这并不是忽略撰写军事历史中其他一切的理由。

几年前，我作为一名考古学家，收集了大量数据，表明智商测试变得更容易了。在 20 世纪，普通人在瑞文测试和相似性测试等测试中获得更多正确答案。智力或 g 计量学家的反应是双重的[编者注：请参阅此处，了解对“一般智力”因素 g 的探索]。首先，他们将智商测试作为测量工具与被测量的特质区分开来，即与智力（或 g，如果你愿意的话）区分开来。其次，他们指出，在缺乏绝对测量尺度的情况下，仅仅因为测试变得更容易这一事实并不能告诉我们特质是否得到了增强。智商测试只是相对的测量尺度，根据成员觉得容易或困难的项目来对群体成员进行排名。项目难易程度的根本转变意味着一切都无法确定。此时，g 计量学家会认为他无法完成测量工作，并开始寻找可以让他完成工作的绝对测量标准（也许是反应时间或检查时间）。

然而，作为一名认知历史学家，我开始兴奋起来。为什么这些项目随着时间的推移变得如此容易？我们的心理武器发生了什么样的变化，类似于从步枪到机枪的转变？这意味着要回到考古学家的角色，并找到区分 1900 年和 2000 年的思想战场。我发现了证据表明，从完全功利主义的态度到具体的现实，发生了深刻的转变，转而采取了一种新的态度。越来越多的人认为对具体现实进行分类很重要（用越抽象的术语越好）；并认真对待假设（这使得逻辑不仅可以处理想象的情况，还可以处理没有具体指代的符号）。

正是最初的文物引起了所有的麻烦。因为它们是智商测试中的表现，而智商测试是测量工具，所以认知历史学家和 g 计量学家的角色混淆了。寻找随着时间推移思维习惯转变的原因并发展其影响，与测量任务根本不相同，即使是智力的测量。现在大家都应该看到，不同的概念主导着两个领域：社会的需求——其从一代到下一代的演变主导着认知历史的领域；以及 g ——衡量个体在认知能力方面的差异。正如 g 计量学家不应低估历史学家的非测量任务一样，历史学家也无权贬低对哪些人在与他人相比时最有可能更快、更好地学习的衡量。

我用了一个类比来打破束缚我们理解智商提高对认知历史的启示的钢铁般坚固的想法链条。我希望它能让心理测量学家相信，我对智商随着时间的推移而提高的意义的解读并非对抗性的。没有人质疑他们有权使用任何最适合他们工作的构造：衡量人与人之间认知技能的差异。

但是，一个阐明一件事的类比可能会引入新的困惑。开发新武器和射击手的体格之间的相互因果关系是开发新的思维习惯和大脑之间相互作用的缩影。

新武器是我们自身之外的技术发展，对生物学的影响最小。也许当我们发射机枪而不是滑膛枪时，我们的扳机手指的锻炼略有不同。但是，从专注于具体和字面意义到抽象和假设的演变是我们思想内部的深刻变化，涉及新的解决问题的活动。

思维和大脑之间的相互因果关系意味着我们的大脑可能与我们祖先的大脑不同。这是一个使用和结构的问题。如果人们从游泳转向举重，新的锻炼会发展不同的肌肉，而增强的肌肉会使他们更擅长新的活动。我们所知道的关于大脑的一切都表明它与我们的肌肉相似。Maguire 等人（2000 年）发现，最好的、经验最丰富的伦敦出租车司机的海马体扩大了，海马体是用于导航三维空间的大脑区域。在这里，我们看到大脑的一个区域在没有其他区域相应发展的情况下，因对专门的认知活动做出反应而发展起来。很可能当我们解决“瑞文式”问题时，我们大脑的某些中心会变得活跃起来，而这些中心过去很少锻炼；或者可能我们提高了整个大脑突触连接的效率。如果我们能够扫描 1900 年的人们的大脑，谁能说我们会看到什么差异呢？

巨大的智商增长是否意味着我们比祖先更聪明？如果问题是“我们在受孕时是否具有更好的大脑潜力，或者我们的祖先是否太愚蠢而无法处理日常生活的具体世界”，答案是否定的。如果问题是“我们是否生活在一个比我们的祖先遇到的认知问题范围更广的时代，并且我们是否已经发展出新的认知技能和能够处理这些问题的大脑？”，答案是肯定的。一旦我们了解了发生了什么，即使有些人喜欢“更聪明”的标签，而另一些人则喜欢“不同”的标签，我们也可以相互交流。过分关注我们使用哪个标签是屈服于文字的暴政。我怀疑大多数读者都会问第二个问题，如果是这样，他们可以说我们比祖先“更聪明”。但最好说我们更现代化，这不足为奇！

智力理论
关于心理测量学和认知历史的论点，即它们实际上是相互补充的，以及关于大脑的评论暗示了一种新的智力理论方法。我认为我们需要一种 BIDS 方法：将大脑 (B)、个体差异 (ID) 和社会趋势 (S) 视为三个不同的层面，每个层面都具有同等的完整性。这三者是相互关联的，每一个都有权提出关于另一个层面应该发生什么的假设。我们的工作是独立地调查它们，然后将它们告诉我们的内容整合到一个连贯的整体中。

BIDS 方法的核心是每个层面都有自己的组织概念，将一个层面的架构概念强加到另一个层面上是错误的。我们必须认识到，智力在一个层面（个体差异）上可以表现为一组高度相关的能力，在另一个层面（随着时间推移的认知趋势）上可以表现为一组功能上独立的能力，而在第三个层面（大脑）上则可以表现为一种混合，大脑的结构和运作是人们在其他两个层面所做事情的基础。让我们看看这些层面及其组织概念。

个体差异：个体在各种认知任务上的表现差异主要与任务的认知复杂度（流体智力 g）相关，或者说与掌握任务的认知复杂度路径（晶体智力 g）相关。信息似乎并不能区分个体的智力水平，但如果两个人有相同的机会，那么头脑更好的人很可能会积累更广泛的信息。我将把适当的组织概念称为“一般智力”或 g，并不打算排除超越“学术”智力局限的改进措施（Heckman & Rubenstein, 2001; Heckman, Stixrud, & Urzua, 2006; Sternberg, 1988, 2006; Sternberg et al., 2000）。
社会：由于社会优先事项的转变，各种现实世界的认知技能随着时间的推移呈现出不同的趋势。我将把这个概念称为“社会适应”。正如我所论证的那样，迄今为止的主要混淆如下：要么坚持使用个体差异层面的组织概念来评估认知进化，如果不是 g 的增长，就认为智商的增长是空洞的；要么坚持使用社会层面的组织概念来否定对个体智力差异的测量（例如，否认有些人确实需要更好的头脑和大脑来应对他们所处时代的主要认知需求）。
大脑：局部神经群因特定的认知训练而发展不同。还有一些重要的因素会影响所有神经群，例如血液供应、多巴胺（一种使神经元更容易接受经验的物质）以及应激反应系统的输入。让我们称其组织概念为“神经联邦主义”。大脑是一个系统，在其中，一定程度的自主性受到整体组织结构的限制。

这个层面的研究人员应该尝试解释其他两个层面发生的事情。大脑生理学家的任务是还原论的。对大脑作用的完美了解意味着：给定关于认知如何因人而异、因时而异的数据，我们可以绘制出大脑事件如何支撑社会和生活历史的图谱。为了详细说明这一点，做出一个简化的假设：在认知时，大脑只执行四种操作：分类或 CL（类似于相似性）；解放的逻辑或 LL（类似于雷文推理）；实践智力或 PI（用于操纵具体世界）；以及词汇和信息获取或 VI。并假设大脑被整齐地划分为四个扇区，分别在执行这四种心理操作时处于活跃状态；也就是说，它被划分为匹配的 CL、LL、PI 和 VI 扇区。

通过大脑的磁共振成像扫描（MRI），我们得到了这些扇区的“图片”。我们不知何故得到了 1900 年的 MRI，可以与 2000 年的 MRI 进行比较。当我们测量 CL 和 LL 扇区内的神经元时，我们发现后来的大脑的神经元“增厚”了。这种额外的厚度准确地预测了本世纪在相似性和雷文推理上的表现增强。

至于个体差异，我们有两人的大脑 VI 扇区在接受相同的新词汇时正在发生的事情的图片。我们注意到，由于最佳的血液供应（我们知道什么是最佳的），一个人的神经元（以及神经元之间的连接）比另一个人的神经元得到了更好的滋养。我们注意到，当神经元被用来学习新词汇时，一个人的神经元被喷洒了最佳量的多巴胺，而另一个人的神经元则没有得到充分的喷洒。我们可以测量出第一个人比第二个人多出的灰质的精确增厚量。这使我们能够实际预测他们在韦氏智力量表词汇子测试中的不同表现。

鉴于以上所述，大脑生理学将已经完成了它的还原论任务。个体之间和世代之间的解决问题差异都将被还原为大脑功能。这将解释各种认知技能在个体差异层面上的相关性趋势，以及它们在社会层面上的功能自主性趋势。当然，这并不意味着在个体差异或社会需求层面上解释人类认知的必要性已经被消除。即使生理学可以预测人们在进行智商测试时的每一个正确和错误的答案，如果不知道职业取决于掌握某些认知技能（社会层面）以及父母想知道他们的孩子是否具有这些技能（个体差异），那么没有人会理解为什么存在这些测试。

关闭窗口
智商随着时间的推移而变化的趋势翻开了伟大浪漫的一页：二十世纪的认知史。我可能在解释其意义时犯了错误，但我希望我已经说服您，它们是重要的。那些对此持有不同意见的人，在我看来，必须断言以下两个命题中的一个或两个。既然智商测试测量的是 g，它们就不可能预示任何其他事物的兴衰。我怀疑有人会捍卫这个命题。除了 g，或者适合 g 范围内的特殊因素之外，对他们没有任何兴趣。我相信有些人就是这样想的，这很可悲。他们将始终通过一个窗口来审视认知的历史。