没有人怀疑我们写或说的话是我们内心想法和个性的表达。但是,除了语言的有意义的内容之外,文本的风格还隐藏着对作者思想的独特见解——例如,无论语境如何,某些词语和词语类别的使用频率。
德克萨斯大学奥斯汀分校的社会心理学家詹姆斯·W·潘尼贝克断言,作者表达其思想的方式揭示了性格。当人们试图以某种方式展示自己时,他们倾向于选择他们认为合适的名词和动词,但他们不太可能控制自己对冠词和代词的使用。这些小词语创造了文本的风格,而这种风格不太容易受到有意识的操纵。
潘尼贝克的统计分析表明,这些小词语可能暗示患者的康复进展,并让我们深入了解公众人物(从政治候选人到恐怖分子)的个性和不断变化的理想。“心理学领域几乎没有人意识到低级词语可以提供大规模行为的线索,”潘尼贝克说。他与同事一起开发了一个计算机程序,用于分析文本,称为“语言调查和词语计数”(LIWC,发音为“Luke”)。该软件还被用于检查其他言语特征,统计数百个类别中的名词和动词,以揭示隐藏的模式。
支持科学新闻事业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻事业 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的有影响力的故事的未来。
字符计数
最近,潘尼贝克和他的同事使用 LIWC 分析了去年秋季总统选举期间候选人的演讲和采访。该软件计算演讲者或作者在特定类别(例如情感或感知)以及指示复杂认知过程的词语中使用词语的次数。它还统计了所谓的虚词,例如代词、冠词、数词和连词。在这些主要类别中的每一个类别中都有子集:是提及悲伤还是快乐情绪更多?演讲者更喜欢“我”和“我”而不是“我们”和“我们”吗?LIWC 回答这些定量问题;心理学家必须随后弄清楚这些数字的含义。在 20 世纪 90 年代中期 LIWC 开发之前,人们手工计数词语的多年心理学研究已经建立了词语使用与心理状态或性格特征之间的稳固联系
例如,政治候选人在他们的演讲风格上表现出明显的差异。约翰·麦凯恩倾向于直接且个人化地向他的选民讲话,使用既带有情感色彩又冲动的词汇。相比之下,巴拉克·奥巴马经常使用因果关系,这表明了更复杂的思维过程。他也倾向于比他的共和党对手更含糊。潘尼贝克的团队在 www.wordwatchers.wordpress.com 上发布了更深入的细分,包括对副总统候选人的分析。
对 LIWC 有用性的怀疑者指出,麦凯恩和奥巴马演讲的许多这些特征无需使用计算机程序即可收集。然而,当分析对象无法接触时,LIWC 可能会提供独特的见解。潘尼贝克对基地组织通信的研究就是这种情况。2007 年,他和几位同事在联邦调查局的合同下,分析了奥萨马·本·拉登和艾曼·扎瓦希里(本·拉登的二号人物)的 58 篇文本。
比较显示了代词能够揭示多少信息。例如,在 2004 年至 2006 年间,扎瓦希里使用“我”这个词的频率增加了两倍,而本·拉登的著作中则保持不变。“通常,‘我’字的使用率越高,对应于不安全感、威胁感和防御感。仔细检查他在语境中‘我’的使用往往证实了这一点,”潘尼贝克说。
其他研究表明,用于表达平衡或细微差别(“除了”、“但是”等等)的词语与更高的认知复杂性、更好的成绩甚至事实被报告的真实性有关。对于本·拉登来说,分析表明,多年来他的文本中的思维过程达到了更高的水平,而他的副手的思维过程则停滞不前。
治愈之词
统计分析量化一个人随时间变化的语言使用情况的能力是 LIWC 等程序的关键优势。2003 年,潘尼贝克和统计学家 R·舍洛克·坎贝尔(现任职于耶鲁大学)使用一种名为潜在语义分析 (LSA) 的统计工具,研究了来自三项早期研究的创伤患者的日记条目,寻找在康复中且很少与医生会面的患者中发生变化的文本特征。研究人员再次表明,内容并不重要。与康复最明确相关的因素是代词的使用。从一天到另一天改变写作视角的患者在随访期间不太可能寻求医疗。
可能是从自己和他人的角度描述自己情况的患者能更快地从创伤经历中恢复过来——这是关于写作负面经历具有治疗作用的已广为人知的观点的变体。或者,LSA 可能只是检测到患者的康复反映在他们的写作中,但并非由写作引起——在那种情况下,LIWC 等程序可以帮助医生诊断疾病和评估治疗进展。研究人员目前正在使用 LIWC 研究许多其他患者群体,包括癌症、精神疾病和自杀倾向患者,以揭示有关他们的情绪健康和精神状态的线索。
尽管语言的统计研究相对年轻,但很明显,分析词语使用模式和写作风格可以带来原本会被隐藏的见解。然而,由于这些工具提供基于概率的预测,因此这些见解永远不会是确定的。“最终分析,我们的情况很像经济学家,”潘尼贝克说。“现在提出标准化的分析还为时过早。但最终,我们都在做出有根据的猜测,就像经济学家可以理解、解释和预测经济的兴衰一样。”
他说,她说
我们的写作和说话方式可以揭示关于我们的身份和性格的大量信息。以下是我们使用与风格相关的词语(如代词和冠词)时可以检测到的许多变量的抽样
性别:一般来说,女性倾向于使用更多的代词和对他人的引用。男性更可能使用冠词、介词和大词。
年龄:随着年龄的增长,人们通常较少提及自己,使用更多积极情绪词语和更少消极情绪词语,并使用更多将来时动词和更少过去时动词。
诚实:说真话时,人们更可能使用第一人称单数代词,例如“我”。他们还使用排除性词语,例如“除了”和“但是”。这些词语可能表明一个人正在区分他们做了什么和他们没有做什么——说谎者通常不擅长处理如此复杂的结构。
抑郁症和自杀风险:公众人物和已出版的诗人抑郁或有自杀倾向时会使用更多第一人称单数代词,这可能表明过度自我专注和社会孤立。
对创伤的反应:在文化剧变发生后的几天和几周内,人们会更少使用“我”而更多使用“我们”,这表明了一种社会联系效应。
注意:本文最初以标题“人如其言”印刷。