仇恨言论是任何社区中最可靠的暴力预测指标之一。研究人员多年来一直致力于开发方法来跟踪其在冲突多发地区的流行程度。它可以作为预测即将发生的暴行事件的早期预警系统。现在,科学家们正试图看看他们是否可以对仇恨言论的反面——他们称之为“和平言论”的东西——做类似的事情,进行衡量。
在一篇发表于《PLOS ONE》的新论文中,一群研究人员使用了一种算法来描述和量化不同国家媒体中的和平言论。他们认为他们的研究结果——识别暴力缺席与普遍存在时期在媒体中流传的词语和短语的能力——可能有助于预测一个国家何时变得更加或更少具有敌意。检测无休止的新闻流中出现的语言的这些细微变化,甚至可能有助于在动荡时期促进公民和谐。“和平不仅仅是没有冲突,”哥伦比亚大学兼职高级研究学者、该研究的合著者拉里·利博维奇说。“社会会自觉地做很多事情来促进和支持[和平]。”
为了检测和平言论的流行程度,利博维奇和他的团队在一个机器学习模型上训练了来自18个不同国家的超过70万篇英语新闻文章,这些文章被分类在一个从高和平到低和平的范围内。研究人员使用了几个指标,包括全球和平指数和世界幸福指数,以确定每个国家在这个范围内的位置。在调整了诸如“the”、“a”或“an”等无处不在的词性之后,他们查询了该算法,以识别来自六个最和平和四个冲突最严重的国家的媒体中最常用的词语。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和想法的具有影响力的故事。
最初,利博维奇预计,在高和平地区发现的文章会更多地使用诸如“和谐”或“温和”之类的词语,而来自动荡地区的报道则会使用“冲突”、“纷争”等等。但结果让他感到惊讶。“这比那更微妙,”他说。
根据他们的模型,研究人员发现,来自和平国家的文章倾向于关注日常生活活动和未来规划。诸如“家”、“玩耍”和“体验”之类的词语很常见。然而,在不太和平的国家,媒体使用了更多与政府权威和控制相关的词语——以“国家”或“安全”等词为代表。

新闻媒体中与更和平国家相关的词语(左)和新闻媒体中与不太和平国家相关的词语(右)。来源:Larry S. Liebovitch 等人在PLOS ONE, Vol 18, No. 11; 2023年11月1日发表的“通过自然语言处理和机器学习揭示的较低和较高和平国家新闻媒体中的词语差异” (CC-BY 4.0)
虽然机器学习模型以前已被用于仇恨言论研究,但这是最早使用它们来描述和平言论的研究之一。“作者们正在采用一种非常有趣和新颖的方法,”马萨诸塞大学阿默斯特分校的社会心理学家琳达·特罗普说,她没有参与这项研究。
但她指出,即使在使用算法并控制了介词短语等之后,高和平国家和低和平国家最常用词语列表之间仍然存在显着重叠。“像‘好’这样的词实际上在两者中都出现,”她说。这可能会歪曲模型对那些没有明确划归为光谱某一侧的国家的评估。
特罗普说,虽然该模型可能能够捕捉到一个国家政府表现出的对比鲜明的和平或敌对态度,但这可能并不代表其大多数公民的观点。对于那些领导人专制的国家来说尤其如此,这些国家的媒体可能受到政府的监控或控制。但是,使用算法来跟踪一个国家媒体中的某些词语,可能仍然可以证明是一个有用的指标,可以表明该国领导层是否随着时间的推移变得更加或更少鹰派。
展望未来,利博维奇和他的同事计划训练其他语言(而非英语)的类似模型。他们还希望创建一个词语仪表板,以指示社会走向更加和谐的趋势。
也许这种类型研究最重要的信息与寻找促进和平的新手段有关。这项研究突出了新闻编辑室、政府和公众之间现有的反馈循环。“最终,这其中的一些结果可能有助于告知记者如何报道事物,”利博维奇说。谨慎选择措辞至关重要,因为它们的含义可能会火上浇油,或者有助于扑灭言语上的火焰。