这是图片哪里出了问题?

心理学家经常使用著名的罗夏墨迹测验和相关工具来评估个性和精神疾病。但研究表明,这些工具通常对这些目的无效

如果要求您描述在墨迹中看到的图像,或为一个模棱两可的插图编一个故事——例如,一个中年男子看向别处,一个女人抓住他的胳膊?为了配合,您将运用自己的情感、经验、记忆和想象力。简而言之,您会将自己投射到图像中。一旦您这样做,许多执业心理学家会断言,训练有素的评估人员可以挖掘您的思考,从而得出关于您的个性特征、无意识需求和整体心理健康的结论。

但他们的结论有多正确呢?答案很重要,因为心理学家经常将此类“投射”工具(向人们展示模棱两可的图像、文字或物体)作为心理评估的组成部分应用,并且结果可能会深刻影响受访者的生活。例如,这些工具通常用作诊断精神疾病、预测罪犯假释后是否可能变得暴力、评估参与监护权争夺的父母的精神稳定以及辨别儿童是否遭受性虐待的辅助手段。

为了衡量它们的 relevance,我们回顾了大量关于投射方法效果如何的研究,重点关注了三种最广泛使用和研究最充分的工具。总的来说,我们的发现令人不安。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


蝴蝶还是野牛?
著名的罗夏墨迹测验——要求人们描述他们在 10 张墨迹系列中看到的内容——是迄今为止最流行的投射方法,每年有数十万甚至数百万人接受测试。以下讨论的研究指的是现代的、经过改进的版本,而不是瑞士精神病学家赫尔曼·罗夏在 20 世纪 20 年代最初提出的版本。

最初的工具在 20 世纪 50 年代和 60 年代受到了严厉的抨击,部分原因是它缺乏标准化的程序和一套常模(来自一般人群的平均结果)。标准化非常重要,因为工具管理方式中看似微不足道的差异会影响一个人对它的反应。常模为确定某人的反应何时超出可接受范围提供了参考点。

在 20 世纪 70 年代,当时在长岛大学的约翰·E·艾克斯纳 Jr. 通过引入他称之为综合系统的东西,表面上纠正了早期罗夏测验中的问题。这套指令为墨迹测验的执行和评分以及对反应的解释建立了详细的规则,并为儿童和成人提供了常模。

尽管综合系统目前很受欢迎,但它通常在两个关键标准上都达不到要求,而这两个标准对最初的罗夏测验来说也是有问题的:评分信度和效度。具有评分信度的工具无论谁评分和制表,都会产生相似的结果。有效的技术衡量的是它旨在衡量的东西:其结果与其他可信工具产生的结果一致,或者能够预测行为,或者两者兼而有之。

为了理解罗夏测验的评分信度缺陷,了解一些关于墨迹反应如何解释的知识会有所帮助。首先,心理学家根据 100 多个特征或变量对收集到的反应进行评分。例如,评估者会记录被测者是查看整个墨迹还是仅查看部分墨迹,记录检测到的图像是异常还是大多数受测者的典型图像,并指出墨水漩涡的哪些方面(例如形状或颜色)最决定了受访者报告看到的内容。

然后,检查者将调查结果汇编成个人的心理档案。作为解释过程的一部分,心理学家可能会得出结论,关注墨迹中的细微细节(例如散乱的污点)而不是整个图像,预示着患者的强迫症,并且在较大墨迹的白色空间中看到事物,而不是在墨迹区域中看到事物,则表明存在消极、逆反的倾向。

为了使任何变量的评分被认为是高度可靠的,两位不同的评估者在检查任何给定人的反应时,应该非常有可能得出相似的评分。然而,最近的调查表明,临床医生严重依赖的许多罗夏测验评分都显示出不令人满意的协议。因此,临床医生可能经常对人们的反应得出截然不同的解释。

同样令人不安的是,对罗夏测验效度的分析表明,它在识别大多数精神疾病方面装备不足——除了以思维紊乱为特征的精神分裂症和其他障碍,例如双相情感障碍(躁郁症)。尽管一些罗夏测验的支持者声称,该方法并不能始终如一地检测出抑郁症、焦虑症或反社会人格(一种以不诚实、冷酷和缺乏负罪感为特征的疾病)。

此外,尽管心理学家经常进行罗夏测验以评估暴力、冲动和犯罪行为的倾向,但大多数研究表明,它对这些目的也无效。同样,没有令人信服的证据支持将其用于帮助检测儿童性虐待。

也出现了一些其他问题。一些证据表明,旨在区分精神健康和精神疾病的罗夏测验常模不能代表美国人口,并且错误地使许多成人和儿童看起来不适应社会。例如,在 1999 年对加利福尼亚州血库的 123 名成年志愿者进行的一项研究中,六分之一的人的得分被认为表明患有精神分裂症。

对于少数族裔来说,墨迹结果可能更具误导性。几项调查表明,非裔美国人、美洲原住民、阿拉斯加原住民、西班牙裔以及中美洲和南美洲人的得分与常模存在显着差异。收集到的研究共同引发了人们对在心理治疗诊室和法庭中使用罗夏墨迹的严重质疑。

对 TAT 的质疑
另一种投射工具——主题统觉测验 (TAT)——可能与罗夏测验一样有问题。这种方法要求受访者根据卡片上绘画中模棱两可的场景来构思故事。心理学家可使用的 31 张卡片中,有些描绘了一个正在沉思小提琴的男孩、一个抓住敞开的门的悲伤女人以及一个抓住一个看向别处的男人手臂的女人。其中一张卡片是完全空白的,是模棱两可的缩影。

TAT 被称为“临床医生的喜悦和统计学家的噩梦”,部分原因是它的管理通常不标准化:不同的临床医生向受访者展示不同数量和选择的卡片。此外,大多数临床医生凭直觉解释人们的故事,而不是遵循经过充分测试的评分程序。事实上,最近一项对近 100 名在少年法庭和家庭法庭执业的北美心理学家的调查发现,只有 3% 的人依赖标准化的 TAT 评分系统。不幸的是,一些证据表明,以直觉方式解释 TAT 的临床医生可能会过度诊断心理障碍。

TAT 有许多标准化的评分系统可用,但其中一些更流行的系统显示出较弱的“重测”信度:它们倾向于在一次图片观看会话到下一次会话之间产生不一致的分数。它们的效度也经常受到质疑;发现积极结果的研究经常与其他调查相矛盾。例如,一些评分系统已被证明无法区分正常人和精神病患者或抑郁症患者。

TAT 的少数标准化评分系统似乎确实在区分个性的某些方面做得很好——特别是成就需求和一个人对他人的看法(一种称为“客体关系”的属性)。但是,许多时候,表现出高度成就需求的个人在实际成就的衡量标准上得分不高,因此该变量预测一个人行为的能力可能受到限制。这些评分系统目前缺乏足够的常模,因此尚不适合在研究环境之外应用,但它们值得进一步研究,以便可能在治疗中使用。

人物画的缺陷
与罗夏测验和 TAT 激发对现有图像的反应不同,第三种投射方法要求被评估者绘制图片。许多此类工具,例如经常使用的画人测验,让受测者描绘一个人;其他工具则让他们也画房子或树木。临床医生通常通过将特定的“符号”——例如身体或服装的特征——与个性的各个方面或特定的心理障碍联系起来来解释草图。他们可能会将大眼睛与偏执狂联系起来,将长领带与性侵犯联系起来,将面部特征缺失与抑郁症联系起来,等等。

与其他方法一样,关于绘画工具的研究也给出了令人严重担忧的理由。在一些研究中,评分者在评分结果上达成良好的一致,但在另一些研究中,一致性很差。更糟糕的是,没有强有力的证据支持符号方法解释的有效性;换句话说,临床医生显然没有理由将特定符号与特定人格特质或精神病学诊断联系起来。也没有一致的证据表明,据称与儿童性虐待相关的符号(例如舌头或生殖器)实际上揭示了性虐待的历史。

反复发现的唯一积极结果是,作为一个群体,人物画画得不好的人患心理障碍的比例略高。另一方面,研究表明,临床医生很可能将精神疾病归因于许多只是缺乏艺术能力的正常人。

某些支持者认为,符号方法在经验丰富的专家手中可能是有效的。然而,一组研究人员报告说,使用画人测验的专家在区分心理正常和异常方面不如研究生准确。

一些不基于符号解释的全局评分系统可能很有用。应用此类方法的心理学家不会假设图画的特定特征与人格特质之间存在一对一的对应关系,而是结合图画的许多方面来得出对一个人适应能力的一般印象。在一项对 52 名儿童的研究中,全局评分方法有助于区分正常人和患有情绪或焦虑症的人。在另一份报告中,全局解释正确区分了 54 名正常儿童和青少年与过度 агрессивный 或 крайне непослушный 的儿童和青少年。全局方法可能比符号方法效果更好,因为聚合信息的行为可以消除来自提供误导性或不完整信息的变量的“噪声”。

因此,我们的文献综述表明,通常情况下,罗夏测验、TAT 和人物画仅在非常有限的情况下才有用。许多其他投射技术也是如此[参见第 55 页的方框]。

我们还发现,即使这些方法评估了它们声称要衡量的心理特征,它们也往往缺乏心理学家所谓的“增量效度”:它们很少能增加可以通过其他更实用的方式获得的信息,例如通过进行访谈或进行客观人格测验。(客观测验旨在寻求对相对明确问题的答案,例如“我经常有伤害自己的想法——是或否?”)投射工具提供的附加见解不足以证明其在金钱和时间上的成本是合理的。

该怎么办?
一些心理健康专业人士不同意我们的结论。他们认为,投射工具具有悠久的建设性使用历史,并且如果使用和解释得当,可以穿透受访者自我报告的表象,从而提供一幅关于心灵最深处的图景。我们的批评者还断言,我们过分强调了负面发现,而排除了正面发现。

然而,我们对自己的结论仍然充满信心。事实上,尽管我们的总体调查结果是负面的,但由于所谓的抽屉效应,它们可能过分乐观地描绘了投射技术。众所周知,科学期刊更倾向于发表证明某些程序有效的报告,而不是发现失败的报告。因此,研究人员经常悄悄地将他们的负面数据存档,这些数据可能永远不会再见天日。

我们发现令人不安的是,心理学家通常在价值尚未得到多项研究充分证实的情况下使用投射工具;如果错误的诊断判断影响治疗计划、监护权裁决或刑事法庭判决,可能会有太多人受苦。根据我们的研究结果,我们强烈敦促心理学家减少他们对大多数投射技术的使用,并且当他们确实选择此类工具时,将自己限制在评分和解释已被证明是可信的少量变量上。

我们的结果也为执业临床医生、心理学学生和广大公众提供了一个更广泛的教训:即使是经验丰富的专业人士也可能被他们的直觉和对缺乏有效性有力证据的工具的信任所愚弄。当大量研究表明旧的直觉是错误的时,就应该采取新的思维方式。

(进一步阅读)

  • 罗夏测验:综合系统,第 1 卷:解释的基本基础和原则。第四版。约翰·E·艾克斯纳。约翰·威利父子公司,2002 年。

  • 对利林菲尔德等人(2000 年)《投射技术的科学地位》的批判。斯蒂芬·希伯德,《人格评估杂志》,第 80 卷,第 3 期,第 260-271 页;2003 年。

  • 临床心理学中的科学与伪科学。斯科特·O·利林菲尔德、史蒂文·杰伊·林恩和杰弗里·M·洛尔编辑。吉尔福德,2003 年。

  • 罗夏测验怎么了?科学面对有争议的墨迹测验。詹姆斯·M·伍德等人。乔西-巴斯,2003 年。

  • 人格崇拜:人格测验如何误导我们的孩子、误管我们的公司和误解我们自己。安妮·墨菲·保罗。自由出版社,2004 年。

投射技术的科学地位。斯科特·O·利林菲尔德、詹姆斯·M·伍德和霍华德·N·加布,《公共利益心理科学》,第 1 卷,第 2 期,第 27¿66 页;2000 年 11 月。可在 www.psychologicalscience.org/journals/pspi/pdf/pspi1_2.pdf 上获取

罗夏测验:综合系统,第 1 卷:解释的基本基础和原则。第四版。约翰·E·艾克斯纳。约翰·威利父子公司,2002 年。

罗夏测验:综合系统,第 1 卷:解释的基本基础和原则。第四版。约翰·E·艾克斯纳。约翰·威利父子公司,2002 年。

对利林菲尔德等人(2000 年)“投射技术的科学地位”的批判。斯蒂芬·希伯德,《人格评估杂志》,第 80 卷,第 3 期,第 260¿271 页;2003 年。

对利林菲尔德等人(2000 年)“投射技术的科学地位”的批判。斯蒂芬·希伯德,《人格评估杂志》,第 80 卷,第 3 期,第 260¿271 页;2003 年。

罗夏测验怎么了?科学面对有争议的墨迹测验。詹姆斯·M·伍德等人。乔西-巴斯,2003 年。

罗夏测验怎么了?科学面对有争议的墨迹测验。詹姆斯·M·伍德等人。乔西-巴斯,2003 年。

人格崇拜:人格测验如何误导我们的孩子、误管我们的公司和误解我们自己。安妮·墨菲·保罗。自由出版社,2004 年。

人格崇拜:人格测验如何误导我们的孩子、误管我们的公司和误解我们自己。安妮·墨菲·保罗。自由出版社,2004 年。

SA Mind Vol 16 Issue 1本文最初以“这是图片哪里出了问题?”为标题发表于 SA Mind 第 16 卷第 1 期(),第 50 页
doi:10.1038/scientificamericanmind0405-50
© . All rights reserved.