克劳斯·凯泽 (Klaus Kayser)出版电子期刊的时间如此之久,以至于他还记得用软盘邮寄给订阅者。他19年的经验让他敏锐地意识到了科学欺诈的问题。在他看来,他采取了非常措施来保护他目前编辑的期刊《诊断病理学》(Diagnostic Pathology)》。例如,为了防止作者试图将互联网上的显微镜图像冒充为自己的图像,他要求他们同时发送原始玻片。
然而,尽管他保持警惕,但《诊断病理学》上发表的一些文章中还是出现了一些可能的研究不端行为迹象。例如,在2014年5月刊的16篇文章中,有6篇包含可疑的短语重复和其他违规行为。* 当《大众科学》告知凯泽时,他显然没有意识到这个问题。“没人告诉过我这件事,”他说。“我非常感谢你。”
《诊断病理学》由施普林格 (Springer)所有,被认为是信誉良好的期刊。在凯泽的管理下,其“影响因子”——一种粗略衡量期刊声誉的指标,由文章在已发表的科学文献中被引用的次数生成——为 2.411,这使其稳居汤森路透在其《期刊引用报告》(Journal Citation Reports)中跟踪的所有科学期刊的前四分之一,并在76种病理学期刊中排名第27位。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保有关塑造我们今天世界的发现和想法的具有影响力的故事能够拥有未来。
凯泽的期刊并非孤例。在过去几年中,同行评审文献中也出现了类似的舞弊迹象,遍及整个科学出版界,包括威立 (Wiley)、公共科学图书馆 (Public Library of Science)、泰勒-弗朗西斯 (Taylor & Francis) 和自然出版集团 (Nature Publishing Group)(《大众科学》的出版商)旗下的期刊。
明显的欺诈行为发生在科学出版和研究领域正在经历快速变革之际。科学家们将发表文章视为晋升、获得终身职位或通过资助获得支持的途径,他们比以往任何时候都更努力地竞争,以使其文章进入同行评审期刊。科学期刊在网络上激增,但即便如此,供应仍然无法跟上对受人尊敬的科学出版物日益增长的需求。令人担忧的是,这种压力可能会导致作弊。
可疑论文不容易被发现。单独来看,每篇研究文章似乎都是合法的。但在《大众科学》对100多篇科学文章中使用的语言进行分析的调查中,我们发现了一些令人担忧的模式——这似乎是在工业规模上试图玩弄同行评审系统的迹象。
例如,其中一篇发表在2014年5月《诊断病理学》上的文章表面上看起来像是对同行评审文献的典型荟萃分析。其作者——来自中国广西医科大学的八位科学家——评估了称为XPC的基因的不同变异是否与胃癌有关。他们没有发现这种联系,并承认他们的论文并不是该问题的最终定论
“然而,有必要使用标准化的、无偏倚的基因分型方法、同质的胃癌患者和良好匹配的对照组进行大样本研究。此外,还应在分析中考虑基因-基因和基因-环境相互作用。考虑到这些因素的研究最终可能会使我们更好地全面了解XPC多态性与胃癌风险之间的关联。”
对于一篇完全普通的论文来说,这是一个完全正常的结论。没有任何应该拉响警报的地方。然而,将其与一篇几年前发表在《欧洲人类遗传学杂志》(European Journal of Human Genetics)(由自然出版集团所有)上的论文进行比较,该论文是对称为CDH1的基因变异是否可能与前列腺癌 (PCA) 相关的荟萃分析
“然而,有必要使用标准化的、无偏倚的方法、同质的 PCA 患者和良好匹配的对照组进行大型试验,评估者对数据视而不见。此外,还应在分析中考虑基因-基因和基因-环境相互作用。考虑到这些因素的研究最终可能会使我们更好地全面了解CDH1-160 C/A 多态性与 PCA 风险之间的关联。”
措辞几乎完全相同,甚至包括笨拙的短语“使我们更好地全面了解”。唯一实质性的区别是特定的基因(CDH1 而不是 XPC)和疾病(胃癌而不是 PCA)。
这不是简单的剽窃案例。许多看似独立的研究团队一直在剽窃相同的段落。《PLoS ONE》上的一篇文章最终可能会“使我们更好地全面了解”XRCC1基因突变与甲状腺癌风险之间的关联。另一篇发表在《国际癌症杂志》(International Journal of Cancer)(由威立出版)上的文章最终可能会“使我们更好地全面了解”XPA基因突变与癌症风险之间的关联——等等。有时措辞略有不同,但在我们发现的十几篇文章中,几乎相同的语言,只是将不同的基因和疾病似乎随意地塞进段落中,就像一种深奥版本的文字接龙游戏,参与者在段落中填写缺失的单词。
我们还发现了其他“填空式”研究的例子。搜索短语“因明显不相关而被排除”检索到十几篇各种类型的研究文章——几乎所有文章都由来自中国的科学家撰写。“使用标准化表格,来自已发表研究的数据”也产生了十几篇研究文章,全部来自中国。“Begger's funnel plot”获得了数十个点击,全部来自中国。
“Beggers funnel plot”尤其具有启发意义。根本不存在 Beggers funnel plot。“它不存在。这就是重点,”西班牙巴塞罗那基因组调控中心 (Center for Genomic Regulation) 的生物学家纪尧姆·菲利翁 (Guillaume Filion) 说 (pdf)。一位名叫科林·贝格 (Colin Begg) 的统计学家和另一位名叫马蒂亚斯·埃格 (Matthias Egger) 的统计学家各自发明了用于查找偏差(悄悄潜入荟萃分析中的偏差)的测试和工具。“Begger's funnel plot”似乎是这两个名字的偶然混合体。
菲利翁意外地发现了“Begger's”测试的激增。在寻找医学期刊文章的趋势时,他发现了一些论文,这些论文的标题几乎相同,图形选择相似,并且存在相同的古怪错误,例如“Begger's funnel plot”。他认为这些论文来自同一来源,即使它们表面上是由不同的作者组撰写的。“很难想象 28 个人会独立发明一种统计测试的名称,”菲利翁说。“这就是为什么我们非常震惊。”
快速互联网搜索发现了一些机构,它们提供有偿安排在同行评审出版物上发表论文的作者身份。他们似乎迎合了那些寻求快速、肮脏的方式在著名的国际科学期刊上发表文章的研究人员。
11 月,《大众科学》要求一位讲中文的记者联系美达中国 (MedChina),该公司提供数十个科学“待售主题”和科学期刊“文章转让”协议。记者冒充购买科学作者身份的人,与美达中国的代表进行了交谈,后者解释说,论文或多或少已被同行评审期刊接受;显然,只需要进行一些编辑和修改。价格部分取决于目标期刊的影响因子以及论文是实验性的还是荟萃分析的。在这种情况下,美达中国的代表提供了在一本影响因子为 3.353 的期刊上发表一篇将蛋白质与乳头状甲状腺癌联系起来的荟萃分析的作者身份。费用:93,000 元人民币——约合 15,000 美元。
美达中国代理论文最有可能的目标出版物是《临床内分泌学》(Clinical Endocrinology)。它是影响因子为3.353的五种期刊之一,并且在主题 matter 上最接近。“显然,这是一个非常令人担忧的问题,”该期刊的高级编辑约翰·贝文 (John Bevan) 说。“一想到这种情况正在发生并充斥市场,我就感到沮丧。”在《大众科学》联系贝文大约两周后,他确认一篇关于乳头状甲状腺癌生物标志物的可疑文章——并且在论文修改期间添加了一位作者——已被识别并拒绝。
这些可疑论文的大部分资金来自中国政府。在《大众科学》确定的前 100 篇论文中,有 24 篇获得了中国国家自然科学基金委员会 (NSFC) 的资助,NSFC 是一个政府资助机构,大致相当于美国的国家科学基金会 (National Science Foundation)。另有 17 篇承认获得其他政府来源的资助。杨卫,国家自然科学基金委员会主席,证实《大众科学》确定的 24 篇可疑论文随后已转交给基金委员会的纪律检查、监察、监督和审计局 (pdf),该局每年调查数百起不端行为指控。“国家自然科学基金委员会每年都会对研究不端行为采取数十项纪律处分,尽管代写论文的案例不太常见,”杨卫通过电子邮件表示。去年,该机构的一项纪律处分涉及一位从互联网站点购买资助申请书的科学家。杨卫强调,该机构采取措施打击不端行为,包括最近安装了针对资助申请书中可能存在的剽窃行为的“相似性检查”。(杨卫声称,自该系统上线一年以来,在约 150,000 份资助申请书中,该检查发现了数百起“高度相似”的案例。)但当谈到论文工厂时,杨卫说,“我们在这方面没有太多经验,当然很乐意听取您的建议。”
一些出版商现在才开始意识到中国论文工厂的问题。“我不知道存在一个作者身份的市场,”BioMed Central 研究诚信副编辑主任吉吉莎·帕特尔 (Jigisha Patel) 说。现在 BioMed Central(由施普林格所有,并出版《诊断病理学》)已注意到这个问题,帕特尔说,“我们现在可以调查并解决它了。”在《大众科学》联系 BioMed Central 两周内,BioMed Central 宣布已识别出大约 50 篇手稿,这些手稿已由虚假同行评审员评估通过。该出版商告诉 Retraction Watch 博客,“可能涉及第三方,并且正在影响同行评审过程。” 这些手稿可能来自论文工厂。我们得以查看大约六篇论文的标题和作者。所有论文的风格和主题 matter 似乎都与其他论文工厂撰写的荟萃分析非常相似,而且所有论文都来自中国作者组。
其他出版商已开始打击大量可疑论文。《PLoS ONE》的编辑主任达米安·帕丁森 (Damian Pattinson)表示,该期刊于去年四月设立了保障措施。“[E]我们收到的每篇荟萃分析都必须经过特定的编辑检查……”这迫使作者提供更多信息,包括他们最初进行这项研究的原因的理由,他说。“因此,实际上能够到达评审员手中的论文的比率下降了约 90%。因此,我们非常清楚这个问题。”即便如此,《大众科学》编制的清单中包含四篇可疑论文,这些论文是在保障措施实施后发表在《PLoS ONE》上的,并且在撰写本文时,美达中国将一篇即将发表的《PLoSONE》文章的作者身份挂牌出售。当我们向帕丁森询问这些时,他回答说:“如果有任何不端行为的迹象,我们将更正和撤回论文。这是一个问题问题,我们非常清楚。”
BMC、公共科学图书馆和其他出版商使用剽窃检查软件来尝试减少欺诈行为。帕特尔警告说,然而,软件并不总是能解决期刊中的剽窃问题,论文工厂“为问题增加了另一层复杂性。这非常令人担忧。”
出版商目前正在进行一场艰苦的战斗。《临床内分泌学》的贝文说,“如果没有内幕消息,就很难监管这件事”。《临床内分泌学》及其出版商威立正试图弥补编辑过程中的漏洞,以标记作者身份的可疑后期更改和其他违规行为。“你必须接受人们是以诚实和善意提交稿件的,”贝文说。
这就是根本威胁。现在许多公司已经弄清楚如何从科学不端行为中赚钱,那么诚实的推定就有可能成为过时之物。“整个同行评审系统都建立在信任的基础上,”帕丁森说。“一旦这种信任受到破坏,同行评审系统就很难处理。”
“我们这里遇到了问题,”菲利翁说。他认为洪流才刚刚开始。“有如此大的压力和如此多的金钱利害关系,以至于我们将在未来看到各种各样的过度行为。”
巴黎·刘 (Paris Liu) 补充报道。
以下列表是 100 篇已发表的文章,这些文章似乎具有填空式科学的特征。列入此列表并不意味着任何给定的文章都是由论文工厂撰写的,也不意味着该文章肯定是抄袭的。然而,鉴于写作模式以及这些文章与先前发表的作品的相似之处,我们认为它们值得出版商仔细审查。>>查看列表
还有更多可疑文章;而且每天都有更多文章发表。这些只是我们找到的前 100 篇。
*更正 (2015 年 2 月 13 日):此句子在发布后经过编辑。原文引用了 《诊断病理学》 2014 年 5 月刊中文章的数量为 14 篇。
延伸阅读
菲利翁,纪尧姆。“PubMed 上大量抄袭者。”
奥兰斯基,伊万。“出版商发现 50 篇涉及虚假同行评审员的手稿。”
约安尼迪斯,J.P.A.、张 C.Q.、林 T.K.、舒利 S.D.、库里 M.J.“基因组时代中国荟萃分析的几何增长。”《PLoS ONE》 8(6): e65602。doi:10.1371/journal.pone.0065602
赫维斯滕达尔,马拉。“中国的出版集市。”《科学》(Science),2013 年 11 月 29 日,第 1035–1039 页。DOI: 10.1126/science.342.6162.1035