本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定代表《大众科学》的观点
《大众科学》的博主梅兰妮·坦南鲍姆对于心理学不是科学的指责感到不安,我理解她的感受。在这种情况下,起因是微生物学家亚历克斯·贝雷佐夫的一篇文章,他在《洛杉矶时报》上发表了一篇简短而引人注目的文章,论证了心理学不是真正的科学。我认为他是对的。我也认为他没有抓住重点。
贝雷佐夫对科学的定义没有偏差,但它也是不完整和过于狭隘的。对心理学缺乏严谨性的批评并不新鲜;人们多年来一直在争论进化心理学等领域中那些不确定的推测以及功能性磁共振成像扫描的局限性。任何大量旨在利用进化和其他类型的“心理学”来解释人类行为的流行的科学书籍只会加剧这个问题。高调的争议和草率的研究无法被重复,也未能提升该领域的形象。但仅仅因为缺少合适的信使就扼杀信息是不公平的。同样的批评也针对其他社会科学,包括经济学和社会学,然而经济学中的辩论似乎不像心理学那样激烈。贝雷佐夫论点的核心是心理学缺乏量化和精确的术语。他指出了幸福等领域的研究,这些领域中的定义既不严格也不客观,而且数据不可量化。
幸福研究是心理学为什么不是科学的一个很好的例子。究竟应该如何定义“幸福”?这个词的含义因人而异,尤其是在不同文化之间。让美国人感到幸福的事不一定让中国人感到幸福。如何衡量幸福?心理学家不能使用尺子或显微镜,所以他们发明了一个任意的量表。今天,我个人感觉是5分中的3.7分。你呢?
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过
订阅来支持我们屡获殊荣的新闻报道。通过购买订阅,您正在帮助确保关于当今世界发现和塑造我们世界的有影响力的故事的未来。
这绝对是事实。但是你知道哪些其他领域也缺乏准确的定义吗?我自己的领域,化学和药物发现。例如,在我们的领域中,关于如何定义“类药”分子,即最有可能作为药物发挥作用的化合物,一直存在争议。多年来出现的“类药”定义足以填满一本电话簿。这场辩论可能会持续很长时间。然而,没有人会否认关于类药化合物的工作是一门科学;事实上,化学家一直在使用指导方针来制造类药分子,而且它们有效。事实上,为什么谈论类药化合物呢,当所有化学有时都被物理学家认为不够科学和严谨?化学中有几个概念——芳香性、疏水效应、极化率、化学多样性——都存在多种定义,并且不能严格量化。然而,没有人(也许除了某些物理学家)否认化学是一门科学。“较软”的领域不如你自己的领域严谨和科学的指责很常见,可以用这个 xkcd 漫画来概括,但这更多的是一种指责,而不是,嗯,一种可量化的真理。
现在,化学定义仍然比幸福或满意度的定义更准确和可量化。但关键是,并非所有可测量的东西都需要量化到小数点后六位才能称之为科学。重要的是我们是否可以提出一致且至少半可量化的定义,这些定义足以做出可测试的预测。心理学研究的价值不在于它的可量化性,而在于它是否揭示了普遍和有启示意义的人性。几天前,我看了 一部关于心理学家和政治思想家汉娜·阿伦特生平的新电影,并思考了阿伦特成名的“平庸之恶”。现在,平庸之恶不像花样滑冰运动员的角动量那样可以严格量化,但很少有人会否认阿伦特对社会科学做出了巨大贡献。这一贡献之所以有效,是因为它是可测试和可重复的(例如在米尔格拉姆式实验中)和真实的,而不是因为你可以使用功能性磁共振成像机器精确测量它。或者考虑一下丹尼尔·卡尼曼在行为经济学方面的开创性工作,该工作导致了对决策和偏见的真正见解;很少有人会认为他所做的事情是不科学的。
事实上,有人认为,当社会科学家开始试图使其学科过于精确时,他们就踏入了危险的境地;华尔街上导致灾难的金融数学模型的激增证明了当金融家开始渴望物理学的严谨性时会发生什么。正如粒子物理学家转为金融建模师的伊曼纽尔·德曼所说:“物理学家试图发现可以解释宇宙 99% 的 3 个定律;金融建模师应该满足于发现可以解释宇宙 3% 的 99 个定律”。那么金融是一门科学吗?关键是,我们对生物学和社会系统的了解仍然太少,无法实现物理学等科学所做的定量预测(另一方面,物理学——取决于你和哪种物理学家交谈——不必经常处理涌现现象)。但这并不意味着我们所说的一切关于人性的东西都是完全不可量化和无用的。
贝雷佐夫所做的一项有价值的贡献是,指明了一个研究领域应该满足哪些标准才能称之为科学。我认为这些标准不完整且过于僵硬,但我认为它们为心理学提供了一个有用的标尺,以审视自身的差距和目标。
为什么我们可以明确地说(心理学不是一门科学)?因为心理学通常不符合一个领域被认为是科学严谨的五个基本要求:明确的术语、可量化性、高度控制的实验条件、可重复性,最后,可预测性和可测试性。
我已经谈论了前两个标准,并指出缺乏明确的术语和可量化性并不会自动将一个领域归入伪科学的范畴。第三个标准实际上很有趣也很重要,而且并不完全清楚如何解决它。由于人类不是电子,因此很难对他们进行实验,并且每次都能获得完全相同的结果。但这正是心理学严重依赖统计数据的原因,以精确确定结果的变异是由于偶然性造成的,还是反映了样本之间的真实差异。诚然,这是心理学将永远存在的局限性,但同样,这并不意味着它将无法发挥作用。这是因为正如梅兰妮准确指出的那样,即使像粒子物理学这样的领域现在也严重依赖统计数据。没有人直接观察到希格斯玻色子,它只是通过复杂的统计显著性测试才可见的。然而,即使其他物理学家也一直认为粒子物理学是“最纯粹”的科学。或者考虑非线性动力学,其中对初始条件的依赖性非常极端,以至于天气和生物种群等系统在一段时间后变得完全混乱。然而,你可以将统计数据应用于这些系统,做出或多或少可靠的预测,并称之为科学。这让我们谈到了贝雷佐夫的最后两点。可测试性和预测性确实是科学的两个基石。我已经指出,可测试性通常可以足够准确以至于有用。至于预测,首先它可以在一个适用范围内。在我自己的领域,我们经常预测新型药物分子的活性或缺乏活性。有时我们的预测有 90% 的成功率,有时有 40% 的成功率。即使它们有 40% 的成功率,我们也可以从中获得有用的数据,尽管也很明显,它们在完全定量使用之前还有一段路要走。而所有这些仍然是科学。
但更重要的是,预测对于科学的重要性其实并不像贝瑞佐夫认为的那么高。物理学家大卫·多伊奇指出,如果你看一个魔术师表演魔术十次,你就能预测他接下来会做什么,但这完全不意味着你真正理解了魔术师在做什么。与普遍的看法相反,在科学中,理解至少与预测同等重要,甚至更重要。而心理学研究绝对提供了一些关于人类在特定情况下行为方式的理解。它帮助我们理解了一些问题,比如:为什么聪明人会相信奇怪的事情?为什么原本正派的人在特定情况下会变成魔鬼(平庸的邪恶)?为什么具有同情心的人在犯罪发生时不挺身而出(旁观者效应)?心理学在所有这些领域都提供了引人入胜的线索和解释,即使这些解释不是百分之百可重复和量化的。这是科学吗?嗯,它不是像物理学那样的科学,但为什么物理学应该成为衡量各个领域“科学性”的标准呢?
与此同时,我同意贝瑞佐夫的观点,即科学不能被重新定义到不再遵守诸如可测试性和可重复性等历史悠久的标准的程度;如果你逐渐开始放宽诸如假设检验和观察等基本要求,你很快就会滑入一个危险的斜坡,斜坡的底部躺着诸如创造论、皮尔当人和占星术之类的东西。但这在现代科学的早期也是如此,那时数据收集占主导地位,解释很少,没有人知道假设检验意味着什么。然而,我们称林奈所做的事情为科学,我们称第谷·布拉赫所做的事情为科学。天啊,甚至炼金术士的一些工作也可以归为科学;毕竟,他们确实改进了诸如蒸馏和升华之类的工艺。在我看来,心理学正处于我们可能称之为林奈阶段的时期,收集和分类数据,并试图找到描述其复杂性的正确理论。对我来说,关于进化心理学和积极心理学的激烈辩论反映了每个领域在其早期阶段经历的浴火考验,以将糟粕与精华分离。如果你采用狭隘的科学定义,那么确实很难称心理学为科学。但重要的是它是否有用。对我来说,这个领域肯定有它的用处。