语言学家使用机器学习技术挖掘大型文本语料库,以检测语言的结构如何赋予其词语意义。他们的工作假设是,彼此靠近出现的术语可能具有相似的内涵:狗比香蕉更常出现在猫附近。
这种深入文本的方法——更正式的名称是分布语义搜索——也可以为分析心理态度提供框架,包括导致女性在科学和技术领域代表性不足的性别刻板印象。例如,英语研究表明,“女性”一词经常与“家庭”和“家人”同时出现,而“男性”则经常与“工作”和“金钱”配对。
语言培养语言刻板印象的方式引起了卡内基梅隆大学认知科学家和特聘教员莫莉·刘易斯的兴趣,她专注于词语传达含义的微妙方式。她与威斯康星大学麦迪逊分校的同事加里·卢皮安一起,决定在早期关于性别刻板印象的研究基础上,探索这些偏见在世界范围内有多普遍。在周一发表在《自然人类行为》杂志上的一项研究中,研究人员发现,这种刻板印象深深地根植于25种语言中。大众科学与刘易斯谈论了这项研究的发现。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们今天世界的发现和想法的有影响力的故事的未来。
[以下是采访的编辑稿。]
您是如何想到这项研究的想法的?
之前有很多研究表明,关于性别的明确陈述会塑造人们的刻板印象。例如,如果您告诉孩子们男孩比女孩更擅长当医生,他们就会对女医生产生负面刻板印象。这被称为显性刻板印象。
但是,很少有研究从大规模词语统计关系的角度来探索语言的另一个方面,即性别刻板印象问题。这旨在了解语言中是否包含以更隐晦的方式塑造刻板印象的信息。因此,您甚至可能没有意识到自己正在接触可能塑造您的性别刻板印象的信息。
您能描述一下您的主要发现吗?
在一种情况下,正如我提到的,我们专注于词语之间的大规模统计关系。为了更具体地说明这一点:我们有很多文本,我们使用这些文本训练机器学习模型,以查看诸如“男性”和“事业”或“男性”和“专业”之类的词是否比诸如“女性”和“事业”之类的词更可能彼此共同出现。我们发现,实际上,它们确实如此[更可能这样做]——在不同的语言中程度不同。
因此,在大多数语言中,与男性相关的词语和与事业相关的词语之间存在很强的关系——同时,与女性相关的词语和与家庭相关的词语之间也存在很强的关系。我们发现,这种关系几乎存在于我们研究的所有语言中。因此,这为我们衡量了在我们研究的 25 种不同语言的统计数据中,性别刻板印象的程度。
然后我们所做的是询问,当通过特定的心理任务测量时,这些语言的说话者是否具有相同的性别刻板印象。我们收集了来自其他研究人员在大型众包研究中收集的超过 60 万人的数据样本。心理任务被称为内隐联想测验 (IAT)。该任务的结构与我们衡量语言中词语之间统计关系的方式相似。在该任务中,研究参与者会看到诸如“男性”和“事业”以及“女性”和“事业”之类的词语,并且个人必须尽可能快地将它们归类为相同或不同的类别。
这就是人们的性别刻板印象的量化方式。至关重要的是,我们接下来所做的是比较这两种衡量标准。语言统计数据中性别刻板印象较强的说话者,其自身也具有较强的性别刻板印象,正如 IAT 所衡量的那样。我们发现两者之间存在很强的关系,这与您所说的语言可能会塑造您的心理刻板印象的假设是一致的。
您们是否还研究了另一种衡量标准?
第二个发现是,不同语言在描述不同性别人群的职业时使用不同词语的程度有所不同。因此,在英语中,我们使用“服务员”(waiter)和“女服务员”(waitress)来描述不同性别人群。我们发现,在职业中做出更多此类性别区分的语言,其说话者更有可能具有更强的性别刻板印象,正如 IAT 所衡量的那样。
难道有些语言将这些区分内置于其语法中吗?
我们还研究了语法上标记性别的语言(例如法语或西班牙语)——通过在词尾以强制性方式添加标记 [例如,西班牙语中“护士”的“enfermero”(阳性)与“enfermera”(阴性)] 是否具有更多的性别偏见。在那里,我们没有发现影响。
这个观察结果是否令人惊讶?
这令人惊讶,因为一些先前的研究表明 [偏见效应的存在] 可能是这种情况——所以我们有点期望找到它,但我们没有。我不会说我们的工作在这个问题上是结论性的。但这无疑提供了一个数据点,表明 [语言的这一方面] 并没有驱动心理偏见。
您关于性别刻板印象的一些发现之前已经在英语中研究过了,不是吗?
我想说的是,我们在这里的贡献是跨语言地探索这个问题,并将心理性别偏见的强度与语言中统计偏见的强度——揭示性别偏见的词语模式——直接进行比较。我们所做的是表明,这两种类型的偏见强度之间存在系统的关系。
您提出的一个观点是,需要做更多的工作来证明语言与性别刻板印象之间的因果关系。您能谈谈这一点吗?
我认为这非常重要。我们所有的工作都是相关的,我们真的没有强有力的证据来支持因果主张。因此,我可以想象几种我们可以获得更强因果证据的方式。一种方法是纵向观察,找到一种方法来衡量过去 100 年来偏见和语言随时间的变化。语言偏见强度的变化是否预示着人们性别刻板印象的后期变化?
找到因果关系更直接的方法是进行实验,在实验中,我们将统计性地操纵一个人接触到的词语模式(语言统计数据)类型——然后衡量他们由此产生的心理性别刻板印象。如果有一些证据表明语言的统计数据与刻板印象之间存在关系,那将为这种因果关系观点提供更有力的证据。
如果事实证明,我们的一些性别刻板印象是由语言塑造的,这是否会在任何方面阻碍人们改变这些刻板印象的能力?
实际上,我认为恰恰相反。我认为这项工作告诉我们刻板印象形成的一种机制。我认为这给了我们一个暗示,即我们如何可能进行干预,并最终改变人们的刻板印象。因此,我还有另一项关于儿童读物的工作,衡量了 [这些] 文本中的内隐刻板印象。在那里,我们发现刻板印象甚至比我们在论文中报告的还要大。一个有希望的未来方向是改变正在给孩子们阅读的书籍——或者正在给孩子们提供的数字媒体。这可能会改变形成的刻板印象。