机器学习算法量化天文学中的性别偏见

计算表明,女性为第一作者的论文引用率被压低了 10%

加入我们的科学爱好者社区!

来自瑞士苏黎世联邦理工学院的研究人员估计,由于性别偏见,第一作者为女性的论文比第一作者为男性的论文的引用率低约 10%。

引用模式中的性别差异之前已在科学领域中被记录。但研究人员以前没有尝试量化差异中有多少是性别偏见造成的。例如,男性和女性可能会发表不同类型的论文;女性可能在不同的科学领域工作,并且可能担任较低级别的职位。

但是,这篇尚未经过同行评审,并于 10 月 27 日发布在 arXiv 预印本服务器上的新论文,试图解释和纠正这些因素。作者拒绝就该论文发表评论,因为他们希望将其提交给《自然天文学》。但其他专家表示,该分析似乎是可靠的。


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过订阅来支持我们屡获殊荣的新闻工作。通过购买订阅,您正在帮助确保关于塑造当今世界的发现和想法的具有影响力的故事的未来。


印第安纳大学布卢明顿分校的信息学家卡西迪·杉本(Cassidy Sugimoto)表示:“这篇论文的新颖之处在于,它驳斥了引用中的性别差异可以归因于论文的具体内容,而不是性别本身的说法。”杉本也发表了关于科学出版物中性别偏见的研究,并表示该论文的发现“既可怕又棒极了”。

估算性别偏见

为了进行研究,研究人员分析了 1950 年至 2015 年间 5 种期刊中的 20 万篇论文。首先,他们训练了一种机器学习算法,以尽可能多地使用与性别无关的因素——例如论文发表的期刊、领域和年份、第一作者所在的位置以及该作者发表论文的年数——来准确计算男性为第一作者的每篇论文的引用次数。

然后,他们将算法应用于女性为第一作者的论文。这组论文(从 1985 年起)实际上比男性作者的论文少获得了大约 6% 的引用次数。但该算法预测,这些论文应该比男性作者的论文多获得 4% 的引用次数。

作者表示,该结果是他们衡量性别偏见的“最佳努力”,但他们的结果应谨慎对待,因为其他因素可能需要纳入他们的算法中。

康涅狄格州纽黑文市耶鲁天文和天体物理中心主任梅格·厄里(Meg Urry)在瑞士研究人员进行研究时向他们提供了建议,她说:“这意味着同等质量的女性和男性将拥有不平等的记录。”她补充说,被引用的次数较少可能会导致更少的资助、演讲邀请和推荐信。“鉴于我们的招聘过程在很大程度上依赖于这些指标,女性在学术界没有达到平等水平也就不足为奇了,”她说。

被压低的引用

英国朴茨茅斯大学的天文学家凯伦·马斯特斯(Karen Masters)表示,良好的引用记录对于研究事业的进步至关重要,因此这些发现可能在一定程度上解释了为什么高级学术职位中女性稀缺的原因。

她说:“我曾听人说过,除非候选人的第一作者论文有 100 次引用,否则他们不会将其列入常任教职的候选名单。所以我认为,女性的引用率下降会对她们在获得工作候选资格方面造成真正伤害。”

这项新研究还指出,女性在第一篇论文发表后的 7 年内发表的文章比男性少 19%。英国乔德雷尔班克天文台卓越干涉测量中心负责人、天体物理学家安娜·斯凯夫(Anna Scaife)表示,这个因素可能比低引用率更具破坏性。“博士毕业后的 4-6 年对于产生有助于他们首次申请永久职位产出至关重要,”她说。

为了解决这个问题,马斯特斯提出了一个直接来自天文学家工具箱的解决方案。她说,女性获得的引用次数可以乘以 1.1,以消除内在的偏见。“我们经常在天文学中观察到的趋势中,通过经验来纠正这样的系统性偏见,”她说。“所以我认为可以类似地处理这个问题。”

本文经许可转载,并于 2016 年 11 月 4 日首次发布

Inga Vesper is a German-British journalist based on London who specializes in climate, environment and politics. She has covered E.U. science for 10 years.

More by Inga Vesper

First published in 1869, Nature is the world's leading multidisciplinary science journal. Nature publishes the finest peer-reviewed research that drives ground-breaking discovery, and is read by thought-leaders and decision-makers around the world.

More by Nature magazine
© . All rights reserved.