本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点
今天,当我浏览我的 Twitter 信息流时,我看到了一个新的链接,指向 Alex Berezow 博士的旧文章,内容是 为什么心理学不能自称为科学。这篇文章本身已经有一年多历史了,但是今天再次看到它的链接,勾起了我旧有的愤怒情绪,当这篇评论首次发表时,我从未有机会公开表达。其他人,比如戴夫·努斯鲍姆,已经 很好地驳斥了这篇文章中的批评,但人们仍然链接到这篇文章(以及其他文章,甚至在 SciAm 网络上的其他地方,仍在呼应同样的批评)意味着显然有些事情是说不尽的
心理学是一门科学。
别再吵吵嚷嚷说它不是了。
关于支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和想法的有影响力的故事。
我显然不能只是说说而已,而不解释为什么心理学是一门科学,尽管有时我希望我可以和生物学家、化学家和物理学家一样,永远不必面对回答这类问题。因此,我将首先引用 Berezow 博士论点的要点,然后解释为什么我每学期入门社会心理学课上的 20 岁学生在本学期第一周结束时就能告诉 Berezow 他为什么错了。
摘自 Berezow 的文章
心理学不是科学。我们为什么能断言这一点?因为心理学通常不符合一个领域被认为是科学严谨的五个基本要求:明确定义的术语、可量化性、高度控制的实验条件、可重复性,以及最终的可预测性和可检验性。
[声称心理学]是“科学”是不准确的。实际上,情况更糟。这是一种重新定义科学的尝试。科学,被重新定义后,不再是对自然世界的实证分析;相反,它是任何洒上一些数字的主题。
首先,如果有人试图在这里“重新定义”科学,那就是 Berezow 自己,他声称科学曾经仅限于对自然世界的实证分析。我是心理学专家,而不是物理学或化学专家,因此我对这些领域的许多事情没有充分的专业知识来解决,因此我的例子可悲地受到限制。但即使我对“硬科学”的有限视角,我也知道没有人可以声称它们都围绕着对自然世界可观察方面的实证分析。据我所知,“硬科学”中存在大量现象——最值得注意的是物理学——是不可观察的。弦理论?量子力学?我的意思是,天哪——物理学家寻找希格斯玻色子多久了,甚至不知道它是否真的存在?!寻找它所需的技术在 30 多年里甚至不存在。“自然”呢?自然是什么意思?由自然产生,所以我们不能将任何化学或人造的东西算作科学?一种有形的物质,所以我们不能将任何理论性的东西算在内?有选择地使用这些资格作为排除心理学和其他“软科学”(请原谅我,当我如此用力地翻白眼以至于我冒着将它们永久性地送回我脑后的风险时)的借口,使其脱离科学学科,而不质疑“硬科学”经常处理“不自然”和“不可观察”的主题这一事实,这简直是懒惰。
现在,让我们来解决心理学概念“不可量化”的指责。诚然,是的——这通常是对心理学最有效的批评(尽管我相信我认识的许多处理 fMRI、ERP、EEG、反应时间和眼动追踪的认知心理学家会对这种公然歪曲他们运作方式的行为感到畏缩)。但是,当我们这些通常研究更模糊概念(比如感觉)的“社会心理学家”来说,我们已经知道我们必须以负责任、严谨的方式解决这些对我们领域的潜在批评。而我们确实做到了。用一种叫做操作化的东西。
在我的社会心理学入门课程的第一周,我给我的学生布置了一个简单的作业——下节课带着对“什么是爱?”这个问题的答案回来。当他们走出教室时,我播放 Haddaway 的歌曲,并告诉他们在 2 天内带着他们将如何定义和衡量“爱”的方式回来,如果他们要创建自己的实验的话。
一个愚蠢的练习?当然。但是在他们交了答案并在下周二回到课堂后,我贴出一个饼图,向他们展示他们的答案真正差异有多大。
大约 25% 的学生倾向于提出封闭式自我报告测量。“在 1 到 5 的范围内询问 A 对 B 的爱有多深。”
大约 25% 的学生倾向于提出更开放式的自我报告测量。“要求 A 写下她对 B 的爱有多深;要求几位独立的编码员阅读这些回复,然后对 A 看起来对 B 的真爱程度做出判断。”
大约 25% 的学生倾向于生理测量。“将 A 连接到一堆心理生理设备上。当 B 进入房间时,测量 A 的心率上升了多少,以及 A 的手掌出汗程度。”
最后,大约 25% 的学生会给我带来惊喜。我不太记得属于这个类别的具体回复,但我最喜欢的一个与让 A 想象 B 即将被推下悬崖有关,然后找出 A 愿意牺牲多少其他人来拯救 B 的生命。我不确定那个实验是否能通过 IRB,但我真的很欣赏这种创造力。
我把其中一些例子贴在黑板上,学生们都笑了。当他们第一次拿到作业时,他们都不可避免地认为这只是一种有趣、轻松的方式,可以在他们上课的第一周获得测验分数——而且这只是我多次播放“What Is Love?”的借口。几乎所有人在最初都认为操作化爱情是一个简单的问题,答案显而易见。当他们看到同学们的回答如此多样化时,他们几乎都感到惊讶,并意识到他们认为“显而易见”的答案对他们的同学来说根本没有那么显而易见。
每个学期,我的 100 名二年级本科生班级都立即理解了 Berezow 博士显然尚未学到的东西:测量是复杂的。无论你研究什么。就是这样。如果你试图解释 薛定谔试图用他臭名昭著的猫问题表达什么,那很复杂。如果你试图弄清楚为什么有 八种不同的刻度来测量完全相同的物理概念,那很复杂。如果你试图创造一种技术,让你能够探测到一种 假设粒子,如果被发现,它将验证整个粒子物理模型,那也很复杂。那么,当我们试图测量一些抽象的东西时,为什么我们应该感到惊讶它仍然很复杂呢?比如感觉?
没有什么能使“手掌出汗”比“为你的伴侣牺牲其他人的假设意愿”更有效地操作化爱情,即使前者是唯一“自然”或“直接可观察”的指标。然而,我们可以看到每个指标如何都有意义,并且可能告诉我们关于这个人及其关系的独特之处。也许手掌出汗是衡量一对夫妇在未来几个月内发生性行为的次数的好指标,但牺牲意愿是衡量这对夫妇最终婚姻能维持多久的更好指标。这是否意味着我们必须把整个“爱”的概念扔出窗外,因为有很多不同的方法来衡量它,并且这些操作化与我们感兴趣的结果有不同的相关性?这是否意味着爱不再值得实证检验?这是否意味着不再值得尝试近似我们如何研究和改善人际关系?还是仅仅意味着我们可能不得不忍气吞声,认真思考我们操作化的理论基础,以便我们能够自信地证明我们的操作选择是合理的,认识到它们的弱点,并理解它们的优势?
现在,当操作化不一致或被滥用时,心理学可能会——并且确实会——遇到问题。例如,这可能是你最终得到太多“研究者自由度”的原因。请不要误解:如果一位心理学家尝试了十种不同的爱情操作化,只有一种产生了显著的发现,因此该操作化被选择用于发表,那是错误的。如果一位心理学家无法使用概念的通常接受的操作化获得他/她想要的发现,并且因为碰巧提供了一个小于 0.05 的 p 值而选择了完全未经测试的东西,而没有充分的理论理由,那是错误的。
但是操作化本身呢?创建、验证和测试一种操作性定义,该定义将充当不可观察或抽象概念的代理?
那是科学,宝贝。接受或拒绝。
最后,与其将操作性定义本身视为整个学科的固有弱点而否定它,难道欣赏操作化中涉及的细微之处不是更有意义吗?与其抛弃心理学,为什么我们不抛弃那些破坏心理学操作化所付出的辛勤工作的耸人听闻的标题呢?如果我们科学作家——包括我自己——在撰写心理学研究时能够更加关注我们如何对待操作化,我认为我们都会对我们从这些讨论中收集到的更多信息感到惊讶。为了找到可衡量、可检验的“模糊概念”的替代品,以便我们可以实验性地控制这些指标,并找到每天朝着科学研究这些我们曾经认为永远无法研究的抽象概念迈进一步的方法,所付出的思考、创造力和纯粹的才华——这真是太美好了。坦率地说,这不仅仅是科学——它还是一门艺术。而且,科学家们为了帮助他们越来越接近这些抽象概念,找到不同的方面来衡量或不同的方式来概念化我们的思想、情感和行为而设计的手段?仅仅这个过程本身就如此出色、如此棘手、如此关键,以至于它通常值得获得与研究结果本身一样多的新闻报道时间。
归根结底,如果我们每次都因为我们生活的这个复杂而美丽的世界变得有点混乱就想把孩子和洗澡水一起倒掉,那么我们对科学的看法一定是多么可悲和简单。
专题图片来自 Creative Commons,来自 DeviantArt 上的 antsandneedles。