谈论引起轰动。两年前,希腊约阿尼纳大学的医学研究员约翰·约安尼迪斯提供了数学上的“证明”,表明大多数已发表的研究结果都是错误的。现在,统计学家使用类似的方法发现——毫不奇怪——研究人员重复一项发现的次数越多,该发现为真的机会就越大。
另一个研究团队表示,研究人员必须从不完善的信息中得出结论,但提供了一种在合理和不合理的风险之间划清界限的方法。
与此同时,作为可能发生变化的迹象,一些遗传学研究人员已开始更紧密地合作,以努力防止错误并提高研究结果的准确性。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于发现和塑造我们当今世界的想法的具有影响力的故事。
在他广为阅读的2005年PLoS Medicine论文中,临床和分子流行病学家约安尼迪斯试图解释为什么医学研究人员必须经常撤销过去的声明。仅在过去几年中,研究人员不得不对低脂、高纤维饮食的健康益处、激素替代疗法的价值和安全性以及关节炎药物万络(Vioxx)进行反思,该药物因被发现会导致高危患者心脏病发作和中风而被撤出市场。
约安尼迪斯使用简单的统计方法,在没有关于已发表研究数据的情况下,认为大型随机临床试验(人类研究的黄金标准)的结果可能有15%的错误,而规模较小、不太严谨的研究结果可能会更糟。
他说,造成错误的最可能原因包括:研究人员缺乏协调以及偏见,例如倾向于只发表与他们预期或希望发现的结果相符的结果。有趣的是,约安尼迪斯预测,该领域的研究人员越多不一定越好——特别是如果他们像支离破碎的美国情报界一样,过度竞争和偷偷摸摸,后者未能分享可能阻止2001年9月11日对世界贸易中心和五角大楼的恐怖袭击的信息。
但约安尼迪斯遗漏了一个转折:根据当前PLoS Medicine上发表的一项研究,每次新的研究重复相同的结果时,发现正确的几率就会增加。该研究的主要作者,美国疾病控制与预防中心的统计学家拉马尔·穆内辛格表示,为了简单起见,他的团队忽略了通过重复相同的偏见来复制结果的可能性。他说,偏见的存在会降低但不会消除重复的价值。
“我完全同意,重复是提高可信度的关键,而且重复比发现更重要,”约安尼迪斯说。但他补充说,偏见也必须被消除,否则重复可能还不够。例如,研究人员在备受吹捧的2006年Science文章中报道说,他们发现了一种似乎会增加肥胖风险的基因变异,并且他们在四个人群中重复了这些结果。上个月,他们承认该发现可能是错误的。
约安尼迪斯说,研究人员在从基因组学和其他研究中获取大量数据以及以不同方式解读数据方面变得越来越老练——就像电视天气预报员每天都宣称某种破纪录的气象事件一样。因此,他说,很容易得出在统计意义上“显著”但在科学上无效的发现。
为了应对这种丰富的贫乏,约安尼迪斯建议研究人员更多地合作以确认彼此的发现。为了实现这一目标,他和其它的遗传学研究人员在两年前建立了一个研究联盟网络,现在由26个小组组成,他说,每个小组都有十几到数百名成员,供研究人员研究各种癌症、艾滋病毒、帕金森病和其他疾病。这些小组旨在帮助每个领域的团队重复彼此的工作。
坦帕市H. Lee Moffitt癌症中心和研究所的肿瘤学家本杰明·朱尔贝戈维奇指出,无论有没有网络,医生和卫生官员也必须根据可能被推翻的已发表研究来决定如何治疗患者。他和他的同事在第二篇PLoS论文中认为,医生的决定应该基于对不同类型研究的误差估计(例如约安尼迪斯计算的那些)、这些研究中报告的治疗的潜在益处,以及如果发现结果是错误的,他们的患者可以承受多少益处(或可以忍受多少伤害)的组合。
“我们不能在100%确定的情况下工作,”朱尔贝戈维奇说。“问题是:假到什么程度算假?”他说,一项良好实施的随机试验更可能产生正确的结果,但如果风险较低且潜在益处很大,那么一项不太严谨的研究可能仍然会让医生满意。
约安尼迪斯同意完全的确定性是不可能的。“如果你患有重病,只有一种药物可用,并且你知道它只有5%的可能性有效,为什么不使用它呢?”他说。但他补充说,实施这种计算比看起来更棘手,因为“我们不能在缺乏强有力的数据证明这一点的情况下,就假定干预措施必然是安全的。”