草率的结论

人们能否被指望做出合理的判断?

一个四岁的孩子看着猴子手偶靠近一个装有红色和蓝色塑料花的瓶子。猴子打了个喷嚏。猴子退后,又回来嗅了嗅,又打了个喷嚏。然后,一位成年人取出红花,换成黄花。猴子走近闻了闻黄花和蓝花,每次都打喷嚏。成年人接着把蓝花换成红花。猴子走近闻了闻红花和黄花,这次没有打喷嚏。

然后,孩子被问到:“你能把让猴子打喷嚏的花给我吗?” 当时在加州大学伯克利分校的心理学家劳拉·E·舒尔茨和艾莉森·戈普尼克做了这个实验,79%的四岁儿童正确地选择了蓝花。正如她们的研究清楚表明的那样,即使是非常年幼的孩子也已经开始理解因果关系。这个过程对于他们理解世界并在其中生存至关重要。

既然早在四岁时就具备了如此强大的辨别能力,那么人们到了成年时,应该非常擅长识别因果关系——因果推理,不是吗? 事实上,大量的当代研究表明情况确实如此,突出了成年人能够做出的细致判断——例如,在不同的情况下,对两个事件之间存在因果关系的数值概率做出一致的估计。


支持科学新闻业

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。 通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


在此,我提出了一些证据,这些证据给出了截然不同的印象:普通成年人对于熟悉话题的日常因果推理似乎非常容易出错。人们在几乎没有证据或根本没有证据的情况下,就将两个事件联系起来作为因果关系,并且他们会根据这些判断采取行动——他们会草率地得出结论。通过更多地了解他们是如何做到这一点的,研究人员可以开发出改进思维的方法。这些努力可以帮助教育工作者实现其使命,即在年轻人的头脑中激发扎实、认真的思考。

对于我们的发现与许多相关文献之间的差异,一种可能的解释是,研究成年人因果推理能力的研究人员通常将其结论建立在对特定背景下成年人群体的一小部分进行研究的基础上——在实验室环境中执行复杂的纸笔任务的大学生。例如,在 2000 年的一项研究中,加州大学洛杉矶分校的心理学家帕特里夏·程和台北国立台湾大学的云文莲向大学生展示了一组实例,描述了喂食不同形状和颜色的植物食品的植物的开花频率。在检查每个案例后,学生在数字量表上对每个因素的似然性或因果影响程度进行了评分,和/或对新实例的结果进行了预测——并且在这样做时表现出良好的可靠性。虽然这些研究突出了大学生在这些任务中表现出的技能,但它们是否代表了普通人在思考日常事务时的认知表现?

为了解决这个问题,我的学生乔安娜·萨博和我去年去了纽约市的宾夕法尼亚车站。我们询问了坐在候车室的 40 人是否愿意花 10 分钟时间完成一项调查,以换取 5 美元。几乎所有人都接受了。我们解释说,一个小组正在尝试在筹款活动中使用不同的娱乐功能组合,以了解哪种组合最能卖票,并向每个人展示了一个包含部分结果的图表。第一个派对的标志列出了幸运抽奖、喜剧演员、服装;其销售额为“中等”。第二个派对列出了幸运抽奖、拍卖、服装;其销售额为“高”。第三个派对列出了幸运抽奖、拍卖、喜剧演员、服装;其销售额为“高”。

当我们与每位受访者交谈时,我们将图表留在视野中,我们问道:“根据他们的结果,拍卖是否有助于门票销售?” 我们还询问了他们对答案的确定程度。他们可以选择“非常确定”、“确定”、“认为如此但不确定”或“只是猜测”。我们对剩余的三个特征:喜剧演员、幸运抽奖、服装提出了相同的问题。

正如您自己可以推断出的那样[参见对面页面的方框],如果您查看第一个和第三个派对,添加拍卖会提高销售额。通过比较第二个和第三个派对,您可以看到添加喜剧演员对销售额没有影响。然而,可用的信息不足以评估幸运抽奖或服装的因果状态(因为它们始终存在)。

宾夕法尼亚车站的这群不同背景的成年人是否表现出与研究人员归因于大学生的隔离因果关系的能力相当的技能? 甚至与早先描述的四岁儿童的技能程度相同? 简而言之,没有。总的来说,他们声称存在的因果关系比证据证明的要多。83% 的人判断两个或多个特征导致销售额增加,45% 的人声称三个或所有四个特征都导致销售额增加(请记住,现有证据仅支持一个特征——拍卖——与结果之间的关系)。更引人注目的是,大多数受访者都非常确信自己是正确的。对于四个特征中的两个,报告的平均确定性大于“确定”(并且趋向于“非常确定”),而对于另外两个特征,平均值略低于“确定”。性别不是一个因素:男性和女性在他们的判断或确定程度方面没有显着差异。

是什么让这些受访者如此确信哪些特征影响了结果,哪些特征没有影响结果? 我们向他们强调,他们应该根据所示特定人群的结果得出结论(而不是根据他们自己关于这些特征有效性的先验信念);在最后的回访询问中,所有受访者都表示他们这样做了。然而,他们的回答表明,他们的判断实际上受到了他们自己关于这些特征应该有多有效的想法的影响。受访者判断幸运抽奖会影响结果(83% 的人这样认为)比他们判断服装会影响结果(33% 的人这样认为)更为普遍,尽管关于这两个特征的证据是相同的。

为了获得更深入的了解,我们向受访者展示了另一项任务[参见对面页面的方框]。

在第二种情况下,没有正确答案。鉴于两个特征:幸运抽奖和服装的因果状态不确定,因此无法做出合理的预测。然而,受访者对其所做预测的确定性仍然与他们对因果判断的确定性一样高。此外,他们的预测提供了信息。例如,为了推断受访者是否判断拍卖特征具有因果关系,我们比较了该人对一对特定案例所做的预测——特别是那些涉及幸运抽奖的两个案例。如果拍卖被视为具有因果关系,则对这两个案例(一个有拍卖,另一个没有拍卖)的预测应该有所不同。如果拍卖被视为不具有因果关系,则其存在与否不应产生影响,并且对这两个案例的预测应相同。同样,比较涉及服装的两个案例的预测使我们能够推断受访者是否判断喜剧演员具有因果关系。

当被要求明确指出某个因素是否具有因果关系(“有助于门票销售”)时,受访者在预测任务中做出的隐含判断往往与他们在判断任务中做出的因果判断不一致。只有 15% 的人在两项任务中做出了前后一致的判断。同样,人们在对有关哪些特征影响了他们的每个预测的问题做出回应时,他们在隐含的因果归因方面也不一致。例如,在判断任务中正确判断将喜剧演员纳入其中没有因果关系的 63% 的人中,大多数人仍然表示喜剧演员的存在与否影响了他们的预测。尤其困难的是认识到,当移除一个特征时,其存在对结果产生积极影响的特征会对结果产生负面影响。

调和不一致之处
我们如何调和在火车站候车的人们做出的不一致且轻率的因果判断——他们声称对此确信无疑——与在大学生甚至四岁儿童身上观察到的推理能力?答案总是多方面的。我们的受访者认真对待这项任务,并且有动力尽最大努力回答问题,以证明他们获得 5 美元的报酬是合理的。但是,他们不太可能像大学生那样容易地将这项任务视为推理测试,旨在评估他们的心理过程,大学生已经熟悉此类测试。大多数大学生都认识到的目的是,不是要找到解决方案(无论是最大化门票销售还是设计足以支撑给定重量的桥梁),而是展示他们如何着手解决问题。大学生已经学会了相应地行事,查看给定的信息并确定他们应该如何使用它来产生答案。因此,毫不奇怪,我们发现具有大学学历的受访者比没有大学学历的受访者做出的判断更合理。

相比之下,那些不具备这种“学术”思维模式的人倾向于专注于解决问题,而很少关注他们在过程中使用的心理操作。在寻求解决方案时,他们会运用他们所知道的一切可能有用的东西。根据他们自己的先前知识,即幸运抽奖似乎比服装更有可能成为筹款活动的赢家,他们判断幸运抽奖是因果关系——即使所提供的证据没有支持这种差异。跟踪他们在早期采访部分中的回答方式,以保持一致性,无助于解决问题,因此不是优先事项。对于这些人来说,目前情况的最佳解读才是重要的。此外,一旦做出决定,表达信心和确定性比犹豫不决更好。

那么,谁在使用“更聪明”的方法呢? 为什么在评估新信息时搁置旧的信念? 如果人们在得出结论时利用他们所知道的一切,难道不是最有可能得出最佳结论吗? 在许多情况下,答案是肯定的。然而,能够评估“给定的信息”以确定它究竟意味着什么(以及不意味着什么)也是一项重要的技能——而不仅仅是在学院的稀薄空气中。

例如,假设我正在考虑尝试我的朋友们正在谈论的新减肥产品,但他们告诉我他们听说它可能致癌。当我去医学图书馆查找有关该产品的最新研究时,我希望能够解读报告的内容,而无需考虑我可能有的先前的想法。在做出决定时,我最终可能会将报告的内容与其他考虑因素结合起来。但是,如果我无法自行解读该文件,我就无法做到这一点。

基思·E·斯坦诺维奇在 2004 年出版的《机器人的反叛》一书中,同样论证了他所谓的“去语境化”推理的重要性,并描述了参与者未能使用它的研究。这种推理的相关性绝不仅限于思考因果关系。例如,在法律审判中做出判决就是一个常见的背景,陪审员需要仅依赖所提供的证据,而不是依赖与该证据相关的一切想到的东西。演绎推理也是如此,它采用了古希腊哲学家亚里士多德的古典三段论。斯坦诺维奇指出,例如,70% 的成年受试者接受了这个三段论是有效的

前提 1:所有生物都需要水。

前提 2:玫瑰需要水。

结论:玫瑰是生物。

因为我们知道结论在现实世界中是正确的,所以很容易接受,即使它在逻辑上并不来自前提。为了确信这一事实,我们只需要将其与形式相同的三段论进行比较

前提 1:所有 hudon 纲的动物都很凶猛。

前提 2:温佩特很凶猛。

结论:温佩特是 hudon 纲的动物。

通常只有 20% 的人接受这个结论是正确的。其他 80% 的人正确地拒绝了它,表现的提高大概是因为没有令人困惑的现实世界知识妨碍了它。

正如我们在火车站进行的研究表明的那样,去语境化并不是认真推理者的心理工具包中唯一的技能。判断的一致性和避免过度的确定性也很重要。过度的确定性反映了“知道你知道什么”(也称为元认知)的失败,并且是思维僵化的基础,而思维僵化是导致人类冲突的主要因素。不一致性同样可能出于利己的目的,使我们能够保护我们最喜欢的理论,而无需对它们施加与我们对其他人的理论相同的证据标准。我们坚持认为,卓越的技能是我们团队获胜的原因,而另一支球队的胜利是由于运气。

作者没有评估早期研究中描述的四岁儿童的因果判断的一致性或确定性。但是我们可以理解为什么这些孩子在评估证据方面可能比我们研究中的成年人更容易。涉及不同颜色花朵的场景几乎没有涉及到关于哪种颜色更可能让猴子打喷嚏的先验知识。相比之下,成年人在活动策划、门票销售和不同活动的乐趣方面拥有丰富的先前经验。这种丰富的知识使他们更难以自行评估证据。

然而,舒尔茨和戈普尼克的研究中受试者表现出的能力确实表明,多变量因果推理(涉及多种潜在原因)中蕴含的潜在推理过程至少在四岁儿童中已经发展到初级程度。更重要的是,这种能力是我们可以用来设计教育经验的基础,这些教育经验将帮助年龄较大的儿童和青少年,甚至成年人,成为更认真的因果推理者。

我的同事和我所做的其他研究表明,如果儿童和成人都获得频繁的机会来练习评估证据并做出因果判断和预测,他们确实会变得更加批判性地思考因果关系。早期青少年学生最初表现出此处说明的各种错误的多变量因果推理。但是,如果他们在几个月的时间里参与此类问题,他们的推理能力就会显着提高。社区大学的年轻成年人也是如此。

向前看
我们可以从我描述的研究中获得的启示是双重的。首先,普通成年人对于日常事务的因果推理实际上非常容易出错。人们经常在没有根据的情况下做出推断,并且具有没有根据的确定性,而且他们很可能会根据许多这些推断采取行动。

其次,尽管人们可能会在对因果关系的判断中草率地得出结论,但我们不应草率地得出结论,认为情况必须如此。思维是可以改进的,并且通过练习,思维会变得更加谨慎和批判。识字和算术“基本技能”的标准化测试成绩已成为衡量学校在教授学生他们需要知道的知识方面取得多大成功的中心舞台。相比之下,学习对人们在日常生活中遇到的问题做出合理的判断,作为教育目标而言,并不是优先事项。

随着今天的人们努力解读关于日益复杂的事务的不断升级的信息量,其中一些信息对其生存具有影响,因此,这种认知方面可能会被认为值得更多关注。通过促进技能的发展,以帮助他们应对这一挑战,我们可以丰富对学生学习重要内容的理解。如前所述,频繁地调查各种形式的证据并从中得出结论确实可以加强推理能力。即使养成问自己和他人诸如“我们如何知道?”和“我们能确定吗?”之类的简单问题的习惯,对于实现健全、严谨的思维目标也大有帮助。

在一个教育工作者面临越来越大的压力,要求他们产生“不让一个孩子掉队”法案要求的标准化考试成绩的时代,让他们甚至考虑承担更多任务是否明智?当然,年轻人必须变得识字和算术。但归根结底,对于教育而言,有什么比帮助学生学会运用他们的思想做出那种将在他们一生中对他们有益的谨慎、周到的判断更重要的目的呢?

(延伸阅读)

  • 谁是理性的?推理中个体差异的研究。基思·E·斯坦诺维奇。劳伦斯·厄尔鲍姆联合出版社,1999 年。

  • 知识的日常生产:认识论理解和陪审员推理技能中的个体差异。M. 韦恩斯托克和 M. A. 克罗宁在 应用认知心理学,第 17 卷,第 2 期,第 161–181 页;2003 年。

  • 机器人的反叛:在达尔文时代寻找意义。基思·E·斯坦诺维奇。芝加哥大学出版社,2004 年。

  • 思维教育。迪安娜·库恩。哈佛大学出版社,2005 年。

迪安娜·库恩是哥伦比亚大学教师学院的心理学和教育学教授,也是《思维教育》(哈佛大学出版社)的作者

更多作者:迪安娜·库恩
SA Mind Vol 18 Issue 1本文最初以“草率的结论”为标题发表于SA Mind 第 18 卷第 1 期(),第 44 页
doi:10.1038/scientificamericanmind0207-44
© . All rights reserved.