破解智商之谜

20世纪见证了“弗林效应”——一代又一代人智商的大幅提升。现在弗林解释了原因

在1984年11月一个相当沉闷的星期六,我在我的信箱里发现了一个重磅炸弹。我收到了一位杰出的荷兰研究人员的数据,并立即看到荷兰男性在一代人的时间内智商取得了巨大的提升。今天,类似的发现几乎发生在30个国家——在我们拥有数据的每个国家。智商的提升可能不会持续下去,但它主导了20世纪。这足以引发信任危机。要么今天的孩子比他们的父母聪明得多,要么至少在某些情况下,智商测试不是衡量智力的好方法。悖论开始成倍增加。只有现在我们才能解决这些悖论——这样做既阐明了智力的本质,也阐明了我们与我们祖先的思想之间的鸿沟。

智力和原子
理解智力就像理解原子:我们不仅需要知道是什么将它的组成部分结合在一起,还需要知道是什么将它们分裂开来。将智力成分结合在一起的是一般智力因素,或g;作为原子粉碎机的是随时间测量的认知趋势。体现这两种力量的最佳智商测试是韦克斯勒儿童智力量表,或WISC,它从1947年一直使用至今。

WISC的10个分测验测量各种认知技能。“相似性”分测验测量一个人感知事物共同点的能力;“词汇”分测验测量你是否积累了日常生活中使用的词汇;“信息”分测验测量你的一般信息储备;“算术”分测验测量你解决数学问题的能力。在某一个分测验中高于平均水平的人,往往在所有分测验中都表现出色。因此,我们谈论的是一般智力因素。一种称为因素分析的数学技术衡量了在各种认知任务中表现相互关联的趋势,而称为g的结构是量化的结果。


支持科学新闻事业

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻事业 订阅。通过购买订阅,您正在帮助确保有关塑造我们今天世界的发现和想法的具有影响力的故事的未来。


一个表现良好的人通常在某些认知任务上超过普通人的结果比其他任务更多。这些任务往往是那些认知上更复杂的任务,这加强了g衡量一般智力的说法。WISC分测验可以根据其g负荷进行排名。这仅仅意味着您将它们从高智商人群在其中胜过普通人最多的分测验到他们表现最不突出的分测验进行排名。

各种特征或任务具有不同的g负荷并不神秘。有音乐天赋的人往往在钢琴上的水平高于平均水平,而在鼓上的水平则低于平均水平。一位有才华的厨师更有可能在制作蛋奶酥这种精细的任务中胜过普通人,而不是在炒鸡蛋这种更简单的任务中。前者比后者更复杂,因此,是测试烹饪水平的更好方法。

随时间推移的趋势
如果一般智力随时间推移而增加,我们预计10个WISC分测验中每个分测验的得分增长都与其g负荷相符。但是,当我们转向智商增长时,我们发现了一些令人惊讶的事情:分测验增长的幅度与分测验g负荷之间存在差异。“相似性”和“信息”的g负荷非常相似,但前者的增长幅度是后者的12倍。记住烹饪。如果技能随时间推移而提高,如果g负荷被忽略,例如,如果炒鸡蛋的烹饪技能意外提高,但制作蛋奶酥的技能没有提高,那就太令人惊讶了。

最近的智商增长显示出一种混乱的模式:“相似性”分测验增长了24分,而“词汇”、“算术”和“信息”分测验在55年间仅增长了大约3分[参见对页的方框]。WISC不仅给出分测验分数,还对智力做出总结性判断,称为“全量表智商”。它的增长幅度巨大,约为18分。瑞文推理测验要求学生找到一系列图片中的下一步,也是分析智商趋势的重要测试。由于美国的可用数据很少,我根据比较数据保守估计,每十年增长5分。与我们相比,我们最近的祖先怎么会如此不聪明呢?更糟糕的是,英国的数据表明,我们必须将这种趋势追溯到1900年。

现在我已经解释了智商繁荣背后的基本概念,我可以提出它产生的四个悖论。其中三个悖论源于智商增长的模式和幅度。第四个悖论也涉及到我们自认为对基因和环境的了解。

WISC分测验的智商增长模式与因素负荷几乎无关。智力怎么可能既是单一的(如因素分析中所示)又是多重的(根据随时间推移的趋势)?这个悖论的关键是,因素分析发生在静态环境中,在该环境中,个体与社会变化保持不变进行比较。然而,随时间推移的智商趋势发生在动态环境中,在该环境中,社会变化改变了文化优先事项,包括哪些概念技能得到最大的强调。

例如,在任何给定的时间,因素分析都会显示短跑和跳高的g负荷很大且相似,也就是说,腿部有弹性的人在这两方面都表现出色。但是随着时间的推移,年轻人可能会发现短跑很浪漫,而跳高很无聊。前者的表现会上升,后者的表现会保持不变。这两个事件之间的相关性掩盖了它们所要求的技能之间几乎没有功能关系的事实。你不会通过以最高速度冲向横杆来最大化你的跳高表现,因为你会错过你的跳跃时机。前者随时间推移的改进与后者没有改进是完全兼容的。

为了解释智商模式,我们需要对随时间推移而提高各种认知技能的功能进行分析。科学的兴起在两个方面引发了巨大的变化:它教会我们,使用科学类别对世界进行分类与操纵世界同样重要;并且它将逻辑从具体事物中解放出来,使我们能够在没有具体参照物的情况下处理抽象概念。在20世纪早期,一个典型的三段论是:“巴吉度猎犬擅长猎兔。那是一只巴吉度猎犬。因此,我将在打猎时使用那只狗。”今天,我们更可能这样说:“只有哺乳动物才生育幼崽。兔子和狗都生育幼崽。因此,它们都是哺乳动物。”

如果问1900年的男孩狗和兔子有什么共同之处,他会说:“你用狗来猎兔。”2007年的男孩会说:“它们都是哺乳动物。”一个世纪前的人们永远不会想到会提供如此微不足道的东西。谁在乎狗和兔子都是哺乳动物?重要的是事物有什么用处以及在自己的控制之下。

WISC的“相似性”分测验在过去一个世纪中表现出令人印象深刻的增长,因为它对于狩猎或功利主义的答案给出零分,而对于哺乳动物或分类的答案给出满分。“词汇”和“信息”等分测验则完全不同。它们抽样了日常生活中所需的核心词汇和一般信息,因此从具体到抽象的转变在很大程度上没有影响到它们。

另一个显示出显著增长的智商测试是瑞文推理测验。这些增长不再神秘。为了做得好,你必须觉得运用逻辑来处理抽象模式是第二天性——也就是说,你必须在一系列形状中感知逻辑顺序,而现代文化更加注重视觉,这有助于做到这一点。

很容易误解“相似性”和瑞文推理测验之间的关系。对各种心理测试的因素分析表明,这两个测试的分数比任何其他一对测试的分数都更相似。现在,这两个测试都显示出相同的巨大增长。然而,这两个测试就像短跑和跳高,几乎没有什么功能上的共同点。它们相关性很高且增长如此相似的原因是,当一个人从用科学的眼光看待世界中受益时,他或她会获得两个明显的优势。一个是将逻辑从具体事物中解放出来以分析抽象概念,这提高了瑞文推理测验的分数。另一个是从将世界视为需要分类而不是仅仅需要利用的事物转变,这提高了“相似性”分测验的分数。同一个人很可能在很大程度上享受这两种好处。但它们仍然与两个完全独立的认知任务有关。

因素分析还表明,“算术”和瑞文推理测验对于一个共同因素都具有较高的g负荷。这一事实鼓励了一种观念,即数学思维和瑞文推理测验提出的认知问题在功能上是相关的。毕竟,瑞文推理测验的问题要求你立即看到形状之间的逻辑关系(无需事先学习的方法)。数学需要处理非语言材料来掌握新的证明。因此,似乎明智的做法是教幼儿瑞文推理测验类型的问题,以便他们成为更好的数学问题解决者。自1991年以来,许多美国学校一直在这样做。

然而,瑞文推理测验的巨大增长和“算术”分测验几乎不存在的增长表明,两者之间不可能存在强大的功能关系。对于非数学家来说,数学与其说是一项逻辑活动,不如说是一个独立的现实,它遵循与自然世界规律不同的规律。正如婴儿探索自然世界一样,儿童必须探索数学世界,并通过自我发现来熟悉其“对象”。瑞文推理测验类型的任务对此没有任何贡献。

我们的第一个悖论得到了解决。在任何特定时间,因素分析都会提取一个稳健的g因子。智力显得是单一的,主要的认知技能都高度相关。随着时间的推移,社会现实揭示了认知技能可以自由地摆脱g,因此智力显得是多重的。如果你想看到g,请停止电影并提取快照;在电影播放时你将看不到它。社会不进行因素分析;它是一个压平因素负荷并强加自身优先事项的巨无霸。

全量表智商和瑞文推理测验的增长表明,我们的父母比我们笨9到15分,而我们的孩子比我们聪明9到15分。几代人之间的这些差距应该在谈话和日常生活中显而易见。否则,我们难道不应该问问自己,智商增长真的是智力增长吗?

但这是一个错误的问题。它暗示了全有或全无的认知进步,而20世纪已经看到了普遍趋势的显著例外。再次查看第26页的方框:显示小幅增长的WISC分测验是那些与学校教授科目最相关的分测验。将它们的趋势与全国教育进步协会(NAEP)测试(通常称为国家成绩单)的趋势进行比较是有启发意义的。

从1971年到2002年,四年级和八年级学生的阅读能力提高了相当于近四个智商点的水平。到12年级时,增长几乎降至为零。如果我们关注1972年至2002年的WISC趋势,我们会发现小学生在一般信息储备方面没有增长,词汇量增长也很小。因此,尽管今天的孩子可能在更小的年龄学会掌握青少年文学,但他们并没有更好地为阅读更具挑战性的成人文学做好准备。如果你每隔一段都要查字典或百科全书,你就无法欣赏《战争与和平》。

从1973年到2000年,四年级和八年级学生的数学成绩提高了相当于近七个智商点的水平。到12年级时,增长降至为零。越来越多的孩子在更小的年龄掌握了计算技能。但是WISC“算术”分测验既测量计算技能,也测量一些额外的东西。例如,考虑这个问题:“如果四个玩具花费六美元,那么七个玩具花费多少钱?”许多能够进行纸上计算的人无法判断所需的两个运算:你必须先除后乘。另一些人则无法进行涉及分数的心算。

我的假设是,孩子们在更小的年龄掌握了计算技能,但在获得数学推理技能方面没有进步。推理技能对于高等数学至关重要。因此,到12年级时,未能发展增强的数学问题解决策略开始产生影响。

我们现在知道为什么今天的孩子在谈话中不会让他们的祖父母感到羞愧。假设我们听到一位最近的高中毕业生与他的祖父(他也高中毕业)谈论他们前一周都读过的小说。我们没有理由相信其中任何一方必须容忍另一方的迟钝。如果我们发现他们都在毕业后不久写了关于时事的文章,我们没有理由相信其中任何一方在词汇量或一般信息供应方面会给我们留下不如另一方的印象。

第三个悖论指的是我们更遥远的祖先,即1900年的美国人。如果我们将今天的普通美国人的智商定为100,那么1900年的美国人的平均智商为50到70,这似乎预示着一场精神发育迟滞的瘟疫。我们现在知道为什么我们不需要得出这样的推论。我们的祖先并不缺乏智慧;只是他们的智慧扎根于日常现实。而正是无法应对日常生活才是一个真正患有精神发育迟滞的人的特征。

文兰适应行为量表告诉我们,在智商快速增长的时期,应对技能保持稳定。将今天的儿童(7至18岁)的表现与1984年随机抽样的儿童的表现进行了比较。儿童在“沟通”和“社会化”分测验中没有取得进步。他们在“日常生活技能”分测验中实际上有所退步。(它有一些过时的项目,例如缝纫或缝边衣服。)

自1900年以来我们没有变得更聪明这一事实并不意味着随时间推移的大规模智商增长是微不足道的。我们可以使用抽象概念、逻辑和假设来解决当科学将思想从具体情境中解放出来时出现的正式问题。自1950年以来,我们在超越先前学到的规则来当场解决问题方面变得更加巧妙[参见对页的方框]。

当同卵双胞胎在出生时被分开并在不同的地方抚养长大时,他们长大后的智商比随机选择的个体更相似。显而易见的解释是他们相同的基因,这些研究被认为是基因强大而环境微弱的证据。然而,一代人与另一代人之间巨大的智商差异似乎表明存在巨大的环境因素。我们的第四个悖论是,确凿的证据如何同时表明环境是微不足道的(亲缘关系研究)和强大的(智商增长)?

考虑一下出生时被分开的同卵双胞胎约翰和乔。他们都生活在一个痴迷于篮球的地区。他们相同的基因使他们都比平均水平更高更敏捷,程度相同。约翰在一座城市上学,在那里他在操场上打篮球稍微好一点,更喜欢篮球,比大多数人练习得更多,引起了小学教练的注意,在球队中打球,并继续参加高中比赛,在那里他获得了专业风格的指导。乔在几百英里外的一座城市上学。由于他的基因与约翰的基因相同,并且由于他比平均水平更高更敏捷,程度相同,他很可能拥有相似的生活经历。

换句话说,出生时可能相当微小的基因优势对最终的篮球技能产生了巨大影响,因为它们与更好的环境相匹配——基因因此获得了“功劳”,因为强大的环境因素(如更多练习、团队合作和专业指导)发挥了作用。

现在想象一个孩子出生时比另一个孩子稍微更有天赋。他们中的哪一个会更喜欢学校,受到鼓励,开始经常去图书馆,进入顶尖班级并上大学?如果那个孩子有一个分开的同卵双胞胎,他也有着非常相似的学业经历,那么是什么解释了他们相似的成人智商?不仅仅是相同的基因——而是那些相同的基因共同选择相似质量环境的能力将是谜题中缺失的部分。

基因“受益”于控制了在表现和环境之间运作的强大反馈回路。基于基因的表现优势导致了一个更多家庭作业的环境;后者放大了学业表现优势,这通过导致进入顶尖班级进一步提升了环境;这反过来再次放大了表现优势,从而促进了进入良好大学环境的机会。这些反馈回路对个人的命运产生了如此大的影响,以至于我的合作者布鲁金斯学会的威廉·T·狄更斯和我称它们为“个人乘数”。

还有一个“社会乘数”。19世纪末和20世纪初的工业革命需要额外的教育年限。当小学教育成为常态时,每个有中产阶级愿望的人都想要一张高中文凭。当高中文凭成为常态时,每个人都开始想要学士学位。经济进步创造了一个中产阶级,他们对智力上刺激孩子、从事高薪专业工作(在这些工作中他们将被期望独立思考)以及享受更多认知要求高的休闲活动抱有新的期望。没有人愿意显得自己作为父母是不称职的,不适合晋升,作为同伴是乏味的。每个人都通过提高自己的表现来应对新的环境,这推动了平均水平的提高;他们对新的平均水平做出反应,这进一步推动了平均水平的提高。结果:一代人在认知技能方面取得了显著提升。

在一代人内部,基因差异驱动反馈过程;在几代人之间,环境趋势驱动反馈过程。看起来强大取决于谁的手握着油门。

一个隐藏的趋势和未来
智商的提高并没有使人们免于轻信。抽象的类别和分析可以用来为胡说八道辩护,而不是为道理辩护。看看有多少人相信创造论、飞碟和占星术。

然而,最近的历史见证了第二个趋势。受过教育的人的语言被一些词语丰富了,这些词语可以大大提高批判性思维能力。这些术语中的每一个都代表一组概念,这些概念描绘了一种适用于社会和道德问题的方法分析。我指的是诸如市场(1776年开始流行)、百分比(1860年)、自然选择(1864年)、对照组(1875年)、随机样本(1877年)、自然主义谬误(1903年)、魅力效应(1922年)、安慰剂(1938年)和证伪(1959年)等概念。

由于大学划分为专业,没有哪个毕业生接受过培训来使用这些术语中的一部分以上。随时间推移的智商增长的全部潜力尚未实现。由于大学本可以在过去一个世纪中的任何时候更好地教育他们的学生,因此21世纪的绩效改进远非确定。

(延伸阅读)

  • 《上升曲线:智商和相关指标的长期增长》。乌尔里克·奈瑟编辑。美国心理学会,1998年。

  • 《什么是智力:超越弗林效应》。詹姆斯·R·弗林。剑桥大学出版社,2007年。

SA Mind Vol 18 Issue 5这篇文章最初以“破解智商之谜”为标题发表于SA Mind 第18卷第5期(),第24页
doi:10.1038/scientificamericanmind1007-24
© . All rights reserved.