ArXiv.org 达到里程碑和反思

空前的成功和资金不足导致预印本服务器面临越来越多的困境

Piles of paper documents in the office

它最初于 1989 年只是少数弦理论家的电子邮件列表,如今已发展成为超过两百万篇论文的合集,并且是物理学家、天文学家、计算机科学家、数学家和其他研究人员的中心枢纽。1 月 3 日,预印本服务器 arXiv.org 凭借一篇题为“仿射迭代和包裹效应:各种方法”的数值分析论文,跨越了这一里程碑。 (相比之下,据信亚历山大图书馆的藏书不超过数十万份手稿。)

宾夕法尼亚州立大学天体物理学教授、arXiv 科学主任斯坦因·西古德森说:“我们是作者快速自由地交流研究成果的一种方式。” 与传统的科学期刊不同,arXiv(发音为“archive”,因为“X”代表希腊字母 chi)允许科学家在研究经过同行评审之前分享研究成果。

在向传统期刊投稿时,作者通常需要等待半年或更长时间才能发表;论文通常在一天内出现在 arXiv 上。作者经常将手稿提交给 arXiv,然后再在同行评审期刊上发表,但越来越多的论文仅在 arXiv 上发布。除了传统的手稿外,arXiv 还包含 白皮书历史概述,甚至 滑稽的愚人节论文


关于支持科学新闻业

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将有助于确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


“它就像我们领域的支柱,”位于日内瓦附近的全球领先的粒子物理研究组织欧洲核子研究中心 (CERN) 的科学信息服务主管亚历克斯·科尔斯说。“它不仅是物理学家和计算机科学家的工具,而且对整体学术交流过程产生了影响。” 例如,生命科学领域受 arXiv 启发的预印本服务器,例如 bioRxivmedRxiv,已被证明在加速冠状病毒大流行期间的生物医学研究方面非常宝贵。

增长是爆炸性的。2008 年,即上线 17 年后,arXiv 的论文数量达到了 50 万篇。到 2014 年底,这个总数翻了一番,达到一百万。七年后,arXiv 的图书馆再次翻了一番,但仍在努力应对其角色:它更接近于精选的学术期刊,还是更像一个不加选择地收集论文的在线仓库?

在这种困惑中,一些研究人员对 arXiv 的审核政策表示担忧,他们说这些政策缺乏透明度,并导致论文被不公平地拒绝或错误分类。与此同时,arXiv 正在努力提高其审核员的多样性,这些审核员主要是在美国机构工作的男性。

在物理学家中,有一种常见的说法:“如果它不在 arXiv 上,它就不存在。” 换句话说,对于广泛的研究学科而言,arXiv 已变得不可或缺,成为科学过程本身的一部分。对于使用它的研究人员来说,arXiv 是他们日常工作流程的一部分:他们可能会在早晨喝咖啡时浏览新版本,在中午之前提交论文,并在晚上下载阅读材料。这种突出的作用证明了 arXiv 的成功,但也表明了存储库的问题不仅仅是它自身的问题,也是科学界的问题。

图片来源:Amanda Montañez;来源:arXiv.org

灾难性的成功

在 arXiv 出现之前,物理学家有一个邮寄预印本的传统。尚未通过同行评审的手稿的纸质副本在全球范围内的实验室和大学图书馆之间发送,供渴望获取最新科学新闻的读者阅读。随着时间的推移,预印本的数量变得巨大,邮件变成了电子邮件。然后,在 1991 年,现在在康奈尔大学的保罗·金斯帕格将他的物理学家同事乔安妮·科恩的电子邮件列表自动化为一个任何人都可以提交和访问的存储库。效果立竿见影。

科尔斯说:“在几年之内,粒子物理学中的几乎每篇文章都首先提交给了 arXiv。” 凭借其令人印象深刻的快速发布时间和随后在物理学、数学和计算机科学的其他领域广泛采用,arXiv 迅速成为检查新结果的主要场所,而不是传统的期刊或会议。

西古德森说:“望远镜在星期五看到了一些东西。到星期一,就有了关于它的论文。到星期二,就有了反驳星期一发表的论文的论文。” “这很有趣。这很令人兴奋。”

现在在韩国科学技术院的研究员金兰宇领导了一项研究,发现高被引 arXiv 论文的作者越来越 不太可能费心在传统期刊上发表。“如果他们从 arXiv 获得了足够的兴趣,他们可能会选择不经历期刊出版过程中的这些麻烦,”金说。她的研究发现,传统期刊仍然对引用具有重要的影响,但它们更多地充当研究的管理者而不是分发者。

尽管取得了成功,但 arXiv 一直在努力应对稳定性和资源问题。该服务器经历了动荡,将其位置迁至康奈尔大学内。目前,只有少数工作人员获得资金来帮助志愿者审核员处理每天多达 1,200 份的提交。“我们是一辆老式经典汽车,锈迹终于显现出来,活塞正在磨损,”西古德森说。“我们人员不足,资金不足——而且这种情况已经持续多年。”

同样,arXiv 作为一个机构的增长并没有跟上依赖它的科学界的增长。“在很长一段时间里,它基本上是由少数人运营的,”科尔斯说。即使在今天,大约 150 个类别也只有大约 200 名志愿者审核员,他们每个人每天可能要处理多达 30 篇论文——这一因素导致了延误和其他问题。

一切适度

当作者提交论文时,它会进入队列,由审核员进行例行评估。如果审核员没有将论文标记为存在问题,通常会在第二天发布。但是,审核员经常介入,将发布延迟数天或数周,重新分类论文,甚至直接拒绝提交。

印度苏拉特卡尔卡纳塔克邦国家技术学院的物理学家迪帕克·瓦伊德说:“他们正在采取的行动似乎与预印本服务器的角色背道而驰。” 瓦伊德指出,他所说的是审核不一致和缺乏透明度。

延迟可能看起来微不足道,但对于争先恐后地宣布某些发现或大胆新假设的科学家来说,即使是几天也可能至关重要。通过将论文重新分类到 arXiv 的“一般”类别——一个通常充斥着质量可疑的研究的包罗万象的类别——审核员可以有效地隔离他们认为不符合更精细类别标准的提交。最后,审核员可以简单地拒绝论文。

西古德森说:“我们必须划清界限,”他指出,arXiv 有时会收到可能是伪科学的提交,例如作者声称“证明了爱因斯坦是错误的”或构建了“万物理论”的提交。为了防止大量胡说八道涌入,arXiv 规定提交作者必须经过“验证”。最初,验证是基于学术隶属关系,但今天它可以替代地依赖于“认可”系统:任何人都可以提交,只要有经过验证的用户,他在同一“学科领域”内撰写了一定数量的论文,为他们担保。“我们有点磕磕绊绊地走下去,因为这总比没有好,”西古德森说。

瓦伊德同意,认可或其他验证系统对于清除伪科学是必要的。但他说,由于预印本服务器不是期刊,arXiv 及其审核员应该简单地放宽标准,减少对拒绝的干预。

西古德森提出了一个反驳。“如果信噪比变得太差,那么它就会变得毫无用处。那么你还不如阅读 YouTube 评论,”他说。在 arXiv 上,大约 6% 的提交会被暂缓发布,大约 2% 会被拒绝。顶级期刊,例如自然科学,接受的论文不到 10%。 (arXiv 在质量控制方面的努力也引发了竞争性预印本服务器的创建,例如 viXra.org,它们以最少的监督欢迎提交。毫不奇怪,主流学者认为此类存储库的效用极小。)

虽然审核不是同行评审,但 arXiv 的审核员与编辑具有相同的权力来拒绝论文。“他们执行了我所称的‘同行评审的单次查看近似’——不假装对快速周转进行全面审查,并应用低得多的门槛,”金斯帕格说。“他们的偏见始终朝着‘接受’的方向,因为我们期望科学能够自我纠正。”

对于一些充满希望的作者来说,arXiv 据称的低接受门槛使任何拒绝都更难以接受。2017 年,瓦伊德的一篇文章因其引言“使用了非常戏剧化且具有误导性的语气”而被拒绝。当他要求澄清以帮助重写引言时,arXiv 代表回应说“审核员不是审稿人,不提供其决定的详细信息。”

由于审核员没有时间对每次提交进行全面的同行评审,因此 arXiv 的政策是不详细说明其拒绝的原因。“我们不想陷入争论,”西古德森说。可以对拒绝或错误分类提出申诉,但该过程很繁琐——基本上重复了同行评审的麻烦,只是为了在预印本服务器上发布。

2021 年 8 月,arXiv 审核员拒绝了备受推崇的中国科学家陆朝阳和潘建伟的论文,他们每个人都在量子研究中贡献了许多“第一”。陆朝阳和潘建伟没有提出申诉,而是明确选择在 viXra 和其他服务器上 发布预印本,尽管陆朝阳在 公开表达了对 arXiv 拒绝的困惑和沮丧之后才这样做。意大利博洛尼亚大学的理论物理学家罗伯托·卡萨迪奥独立审查了这篇论文,无法理解它为何被拒绝。卡萨迪奥说:“它调查的主题完全在 arXiv 的广义相对论和量子宇宙学类别范围内。“结果是对还是错是 arXiv 读者群体可以——也应该——有机会独立评估的事情。”

寻求代表性

arXiv 某些困境的一个来源可能是其审核员阵容的不平衡。在存储库的大约 200 名审核员中,只有 13% 是女性,并且如前所述,大多数审核员是在美国机构工作的男性。许多审核员已经在他们的领域工作了几十年,从数学、物理学和其他物理科学领域的多样性甚至低于现在的时代开始。

西古德森承认:“如果 [arXiv 的审核员] 反映了本质上相当于终身研究小组的人口结构,那将是很好的。” 但招募新团队成员很困难,因为审核是一项基本上吃力不讨好的任务,几乎没有职业回报,而且有很多缺点。特别是女性审核员,经常成为辱骂性电子邮件的目标。

除了性别和国籍方面明显的失衡之外,瓦伊德还指出了意识形态代表性方面更隐蔽的问题。在统一量子场论和引力方面,弦理论仍然比循环量子引力等竞争方法更受欢迎。审核员,就像期刊编辑一样,有权决定发表哪些类型的理论。虽然没有收集到可靠的数据来证实这种怀疑,但瓦伊德认为,循环量子引力的支持者比弦理论家更常被拒绝。

沿着所有这些方向实现审核员多样化是否会解决批评者的抱怨尚不清楚。毕竟,没有“中国物理学”或“美国数学”,国际科学界的成员有很多共同之处。但是审核员多样性问题和过度热心或不适当的拒绝问题可能相关。

六年前,日内瓦大学的量子物理学家尼古拉斯·吉辛声称,在他们的论文于 2014 年被拒绝后,他的 学生受到了 arXiv 的审查。 (该论文的修改版本 随后通过了同行评审,并于 2015 年发表在《物理快报 A》上。) 对于吉辛来说,该事件提出了一个问题:arXiv 属于谁——是运营该网站的工作人员和志愿者,还是为它提供研究成果的全球科学家社区?

金斯帕格说,arXiv 的最初意图是“属于”更广泛的物理学界,但他指出,虽然该服务器最初是为物理学家设计的,但如今计算机科学论文几乎占了提交的大多数。

尽管 arXiv 在法律上以康奈尔大学为中心,并得到美国西蒙斯基金会和一个国际学术机构联盟的财政支持,但科尔斯说,“我们的研究人员感觉 arXiv 属于科学界。”

如果它真的属于依赖它并用两百万篇论文填充它的更广泛的科学界,那么这对 arXiv 的未来意味着什么?

对于瓦伊德来说,答案很明确:“一切照旧”的做法注定要失败。“没有问责制——零,根本没有,”他说。他认为 arXiv 需要对其标准更加透明,并解释拒绝的原因。西古德森表示,在 arXiv 实施更全面的同行评审的提议极不可能成功。但他表示,他计划在未来几年增加审核员的数量,至少达到 300 人,以便每个类别至少有两名审核员。

金斯帕格也承认,arXiv 的独特地位赋予了社区责任。“尽管如此,在许多领域,世界的科研成果都通过单一门户传递,这仍然是一个原则问题,”他说。“[ArXiv 的] 行动和任何无意的偏见都应不断受到审查。”

如果目前的步伐保持下去,arXiv 将在本十年结束前再次将其图书馆翻一番。未来两百万篇论文将包含哪些发现是无法知道的,但 arXiv 在科学领域的明星作用似乎不太可能消退。

在最近的图书馆翻新期间,一项调查询问了欧洲核子研究中心的工作人员想要什么:新家具?更好的咖啡?“他们说的是‘在那里放一个大屏幕,并编写一个脚本,自动显示 arXiv 每日新提交的内容’,”科尔斯说。“它可能会成为欧洲核子研究中心图书馆的中心。”

© . All rights reserved.