数十个实验室响应号召,加强心理学研究的可靠性

国际合作重现了早期13项研究中的10项

一个大型国际小组成立旨在测试心理学实验的可靠性,他们成功地重现了过去13项实验中的10项结果。该联盟还发现,有两项效应无法重现。

近年来,心理学界因其结果的可靠性而受到越来越多的质疑,此前多次未能重复经典研究。未能重复可能意味着原始研究存在缺陷,新实验做得不好,或者受审查的效应在不同环境或人群之间存在差异。

为了解决这场“可重复性危机”,36个研究小组成立了“多实验室重复项目”,以重复13项心理学研究。该联盟将早期实验的测试合并成一份问卷(预计需要15分钟完成),并将其发送给来自12个国家的6344名志愿者。


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和思想的具有影响力的故事。


该团队选择了一系列代表心理科学多样性的效应,从已被多次重复的经典实验到尚未重复的当代实验。

在不同的样本中,有10种效应被一致地重复出来。其中包括新泽西州普林斯顿大学经济学诺贝尔奖得主兼心理学家丹尼尔·卡尼曼的经典成果,例如得失框架效应,即人们更愿意冒险以避免损失,而不是获得收益;以及锚定效应,即一个人收到的第一条信息可能会对后续决策引入偏差。该团队甚至表明,锚定效应比卡尼曼最初的研究表明的要强大得多。

令人鼓舞的结果
“这对心理学来说是一项非常重要的举措,”加州大学洛杉矶分校的心理学家丹尼·奥本海默说,他的工作受到了审查,但他没有参与合作。“这意味着可重复性问题虽然绝非微不足道,但可能不像该领域的一些批评家所暗示的那样普遍。” 

项目联合负责人、弗吉尼亚州夏洛茨维尔开放科学中心的心理学家布莱恩·诺塞克认为,结果令人鼓舞。“这表明我们领域中存在重要的、可重复的效应,而且是一致的,”他说。“但这并不意味着每13种效应中就有10种可以重复。”

卡尼曼表示同意。他说,这项研究“似乎做得非常好,而且完全令人信服”,“尽管从这项单一的努力中对整个研究领域得出极端结论肯定为时过早”。 卡尼曼在2012年发表了一封公开信,呼吁对启动效应研究进行“菊花链”式重复,在这种效应中,微妙的、潜意识的线索据称会影响后续行为。

在最新调查中接受审查的13种效应中,只有一种得到微弱支持,而两种根本没有被重复出来。两种不可重复的效应都涉及社会启动。其中一种效应是,人们在接触金钱后,增加了对当前社会制度的认可。另一种效应是,美国人在看到美国国旗后,表达了更保守的价值观。

缅因州沃特维尔科尔比学院的社会心理学家特拉维斯·卡特领导了最初的国旗启动研究,他说他对结果感到失望,但完全信任诺塞克团队,尽管他想在进一步评论之前审查他们的数据。伊利诺伊州芝加哥大学的行为科学家尤金·卡鲁索领导了最初的货币启动研究,他说:“鉴于“多实验室”项目“规模更大、更多样化的样本”,我们应该利用这种缺乏重复性的情况来更新我们对这种效应的可靠性和普遍性的信念。”两位研究人员都对这项倡议表示赞赏。

公开文档
多实验室团队由佛罗里达大学盖恩斯维尔分校的理查德·克莱因和凯特·拉特利夫以及意大利帕多瓦大学的米开朗基罗·维亚内洛协调,他们发现结果在很大程度上不受志愿者国籍或实验设置的影响——无论是在线还是在实验室进行。当出现差异时,差异仅限于锚定等大型且明显的效应,而不是像看到国旗而被启动这样的小型且微妙的效应。

这与经常被引用的观点相矛盾,即一些心理学研究,特别是那些关于微妙的社会启动效应的研究,很难重复,因为它们对诸如研究样本或原始研究人员的技能等因素很敏感。社会启动研究难以重复这一事实“对我个人来说一直很困难,”诺塞克说,“因为社会启动是我研究的一个重要领域”。

多实验室项目的计划在可能的情况下经过了原始作者的审查,公开记录,并在《社会心理学》杂志上注册,其方法在进行任何实验之前都经过了同行评审。结果现已提交给该杂志,并可在网上查阅“这种开放性应该成为所有研究的标准,”伊利诺伊大学厄巴纳-香槟分校的丹尼尔·西蒙斯说,他正在协调一项类似的合作尝试,以验证本研究未涵盖的经典心理学效应。“我希望这将成为心理学中的一种标准方法。”

奥本海默说,其他学科也可以从“多实验室”的方法中受益。“心理学并不是近年来唯一在重复性方面遇到问题的领域。” 

本文经《自然》杂志许可转载。这篇文章最初于2013年11月26日发表

© . All rights reserved.