性格测试有多准确？

鲜有性格评估被认为是可靠的，研究人员表示，在学术界以外使用它们值得商榷

如果您正在寻找对真实自我的洞察，那么有很多性格问卷可供选择。有些很愚蠢，比如互联网测验，它告诉每个参加测验的人，他们的核心是拖延症患者。另一些问卷则更为严肃，它们被开发和销售为帮助人们聘请合适的候选人或找到爱情的工具。

问题是，如果你问专家，这些问卷中的大多数可能不值得花钱。“你应该持怀疑态度，”加州大学戴维斯分校的性格研究员西蒙·瓦齐尔说。“在我们进行科学测试之前，我们无法区分它和占星术等伪科学之间的区别。”

迈尔斯-布里格斯类型指标是一个流行的但值得怀疑的商业性格测试的著名例子。这份问卷将人们分为16种不同的“类型”，而且，评估通常会建议某些职业或浪漫配对。个人费用为15至40美元，但心理学家表示，由于各种原因，该问卷是现存最糟糕的性格测试之一。它不可靠，因为一个人的类型可能会每天都在变化。它给出虚假信息（一位研究人员称之为“虚假的东西”）。问题令人困惑且措辞不当。瓦齐尔将其总结为“令人震惊的糟糕”。

支持科学新闻报道

如果您喜欢这篇文章，请考虑通过以下方式支持我们屡获殊荣的新闻报道订阅。通过购买订阅，您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和思想的具有影响力的故事。

明尼苏达大学的名誉心理学家吉姆·布彻说，性格问卷大约在一个世纪前开始发展。“他们从第一次世界大战期间开始询问有关个人思维和行为的问题，”他说。“这些是为了研究性格问题和精神健康问题。” 他补充说，重要的是，美国军方希望这些问卷能够帮助淘汰不适合驾驶军用飞机的士兵。

布彻表示，在20世纪上半叶，许多学者开始创建不同的性格量表。“不仅仅是在精神健康诊断方面，还在于性格是什么样的，”他说。他指出，当时几乎所有评估的问题都在于，它们都是建立在创建者对性格的主观感受之上的。“然后人们开始提出问题，它们真的测量了他们认为他们正在测量的东西吗？这些结论有多可靠，它们有效吗？”

布彻将随后的情况描述为科学方法对性格系统和问卷的大规模淘汰。然而，有一种性格模型确实在20世纪幸存下来。它在今天的学者中很受欢迎，也是瓦齐尔在她的研究中使用的模型。它被称为大五人格特质（又名五因素模型），它是在布鲁克斯空军基地从1961年开始的三十多年里发展起来的。从那时到20世纪90年代，包括刘易斯·戈德堡、沃伦·诺曼、保罗·科斯塔和罗伯特·麦克雷在内的几位心理学家帮助将该模型发展成现代形式。

瓦齐尔说，在开发大五人格模型时，心理学家试图避免困扰早期性格研究人员的陷阱——比如主要根据直觉选择标准。相反，大五模型采取了一种整体方法，通过汇编每一个可以被认为是性格特质的词语，并创建关于它们的简单、直接的问题。例如，在1到5的范围内，你外向、善于交际吗？天性宽容吗？根据人们对初始调查的回答，研究人员使用统计方法将似乎聚集在一起的特质（如“健谈”和“善于交际”）分为五个基本类别：外向性、尽责性、宜人性、神经质和对经验的开放性。另一个模型，即2000年由卡尔加里大学的心理学家Kibeom Lee和安大略省布鲁克大学的Michael Ashton创建的HEXACO人格结构模型，与之相似，但增加了一个额外的类别：诚实-谦虚。

大五模型的核心是其简洁性。它不将任何人划分为“类型”，只是告知他们在性格特质连续谱上的位置。瓦齐尔说，没有技巧，也没有惊喜需要揭示。“在某种程度上，这令人失望。这仅仅意味着性格测试只能告诉你你告诉它的内容。” 她补充说，你不会学到任何你已经不了解自己的东西，它的准确性完全来自于你在回答问题时的诚实和自我反思程度。

瓦齐尔说，在最好的情况下，你可以将其用作比较工具，它可以告诉你，与参加过同一测试的其他人相比，你的外向性排名如何。有一些研究表明，某些大五因素得分与某些结果相关——例如，尽责性与更长的寿命相关，外向性与销售代表更高的销售额相关。“但这并不意味着外向性高的人会成为更好的销售员，”瓦齐尔说。相关性只是相关性；它们可能是偶然的。但商业性格评估似乎在很大程度上依赖于这种相关性。例如，The Predictive Index公司的一项评估，该公司衡量行为特征并将性格概况与工作匹配，在其自身的研究中将这种相关性视为成功的衡量标准。“[我们表明]在一个客户，一家零售珠宝商中，支配欲或攻击性的增加导致了125,000美元的收入，”该公司的一位高管萨德·彼得森说。彼得森说，The Index背后的想法是利用这些措施来帮助“将人与[工作]职位结合起来”。

加州州立理工大学波莫纳分校的心理学家兰迪·斯坦说，这种性格评估——特别是那些针对招聘人员和经理的评估——旨在揭示一种“关于人的隐藏真相”。“他们假设存在你的本质和工作的本质，你应该在招聘中将这两件事匹配起来，”他说。“但我不认为存在隐藏的真相——即使存在，性格测试也无法做到这一点。”

斯坦说，像大五模型一样，任何性格或行为评估都无法知道你在问卷中没有明确回答的事情。有时商业性格测试会提出奇怪的问题——比如，你认同蛇吗？或者你对某种颜色有何反应？——并试图从你的答案中得出推论。斯坦说，这些类型的结论会冒险进入伪科学领域。

斯坦认为，一些性格评估可能是伪科学的还有其他原因。“这些测试会告诉人们什么是真什么是假，这取决于人们愿意为之付出多少钱，”他说。“他们作为公司的流程是告诉人们任何可以销售产品的东西。” 相比之下，大五和HEXACO模型是由经验过程和独立的同行评审塑造的，这些评审表明人们的分数往往是一致的，并且使用这些模型做出的预测是可重复的。斯坦说，如果没有这些，性格测试应该受到极大的怀疑。

一些公司，如The Predictive Index，表示他们的产品符合这些标准。该公司投资进行了一次审计，向挪威分类公司DNV GL支付了超过20,000美元，以审查他们的产品并证明其符合欧洲心理学家协会联合会制定的标准。Index的两名代表，格雷格·巴内特和奥斯汀·福西也表示，基于他们的方法的预测是准确的。

也许吧。加州大学戴维斯分校的瓦齐尔说，达到某种程度的有效性是相当容易的。“如果我只是让你做一个关于外向性的问卷，你可能会做得很好，”她说。这是因为我们都是性格的评判者，而且我们经常在直觉上知道该与谁约会或聘用谁以及我们是谁方面做得很好，瓦齐尔说。如果这个过程看起来令人困惑，或者问题偏离到抽象领域，那就是一个危险信号。她说，性格并没有那么神秘。