基因组测序先驱克雷格·文特尔(Craig Venter)的一篇论文遭到了猛烈批评,该论文声称可以从人们的 DNA 中预测他们的身体特征。该论文的审稿人甚至一位共同作者表示,该论文夸大了利用一个人的基因来识别个人的能力,这可能会引发对基因隐私的不必要担忧。
这篇论文1 于 9 月 5 日发表在《美国国家科学院院刊》(PNAS)上,文特尔及其位于加利福尼亚州圣地亚哥的公司 Human Longevity, Inc. (HLI) 的同事对 1,061 名不同年龄和种族背景的人的整个基因组进行了测序。研究人员利用遗传数据以及参与者的高质量 3D 面部照片,采用人工智能方法找到了 DNA 序列中的微小差异,称为 SNP,这些差异与面部特征(如颧骨高度)相关。研究小组还搜索了与人的身高、体重、年龄、声音特征和肤色等因素相关的 SNP。
该方法在 HLI 数据库中随机选出的十人组中,正确识别出个人的概率为 74%。根据该论文,研究结果表明,执法机构、科学家和其他处理人类基因组的人员应谨慎保护数据,以防止人们仅通过 DNA 就被识别出来。“HLI 研究人员的核心信念是,在公开访问的数据库中,现在不存在真正去身份化和完全隐私的概念,”HLI 在一份声明中表示。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的具有影响力的故事的未来。
有争议的主张
但是,其他研究过这篇论文的遗传学家表示,在他们看来,这种说法被大大夸大了。“我不认为这篇论文会增加这些风险,因为他们没有展示任何能够从 DNA 中区分个人的能力,”宾夕法尼亚州立大学大学公园分校的人类学家马克·施里弗 (Mark Shriver)说。他说,在随机选择的十人组中——尤其是在像 HLI 这样规模小且多样化的数据集中选择的——仅知道年龄、性别和种族就可以排除大多数人。
为了证明这一点,纽约市哥伦比亚大学的计算生物学家 Yaniv Erlich 查看了 HLI 论文中的年龄、性别和种族数据。 在 9 月 6 日发表在预印本服务器 bioRxiv 上的一项研究2中,他计算出仅知道这三个特征就足以在 HLI 数据集的十人组中识别出个人,其概率为 75%。 Erlich 认为没有必要了解人们的基因组。 此外,他说,HLI 从 SNP 重建的面部结构并非高度特异性——它们看起来既像该人,也像任何该性别和种族的人。
在发表在《PNAS》之前,该论文曾提交给《科学》杂志,为该杂志审阅该论文的施里弗说。他说,HLI 的实际数据是可靠的,他对该小组通过对染色体末端(随时间缩短)进行测序来确定年龄的新颖方法印象深刻。但他表示,该论文并没有像其声称的那样证明可以通过 DNA 识别个人。“我认为它完全歪曲了他们所做的事情和他们所发现的事情,”他说。
HLI 表示,其论文指出,根据对一千多个基因组的研究,有可能使用多个参数(其中一个人的面部只是其中之一)来识别某人。“它预示着预测将变得越来越精确,”HLI 发言人希瑟·科瓦尔斯基 (Heather Kowalski) 说。 HLI 表示,它坚持其方法论,并承认样本集很小。该公司补充说,“HLI 团队正在对 BioRxiv 中 Yaniv 的批评进行反驳 [原文如此]”。
施里弗说,他和埃尔利希在为《科学》杂志审阅该论文时,向研究作者指出了他们的担忧。 施里弗和埃尔利希都表示,该杂志最终拒绝了这篇论文。(《科学》不对未发表的研究发表评论。)该论文随后被提交给《PNAS》,该选项允许美国国家科学、工程和医学研究院的成员(如文特尔)选择审稿人。 其中两人是信息隐私专家,其余的审稿人是生物伦理学家。
《PNAS》证实,文特尔为这项研究选择了所有三位审稿人。 HLI 拒绝就该论文的《PNAS》审查过程发表评论。
隐私问题
计算生物学家兼论文共同作者杰森·派珀 (Jason Piper) 现在在新加坡的苹果公司工作,他同意该论文歪曲了他和其他共同作者提出的研究结果。派珀补充说,他与该公司的合同放弃了他批准手稿提交的权利,允许 HLI 随意呈现他的数据。 HLI 对此的回应是确认“作者有机会审阅并评论该论文”。
派珀此后在 Twitter 上严厉批评了该论文,并表示,在他看来,HLI 在鼓励限制访问 DNA 数据库方面存在潜在的利益冲突。 HLI 是一家营利性公司,正试图建立世界上最大的基因信息数据库。
“我认为基因隐私非常重要,但所采取的方法是错误的,”派珀说。“为了从基因组中获取更多信息,人们必须分享。” 他说,一种更有用的方法是找到一种在不让个人被识别的情况下公开基因组数据的方法。
为了回应有关该论文的批评,该公司在一份声明中回应说,“HLI 坚持保护基因组数据和促进数据交换的现代解决方案”。它补充说,该论文旨在引发关于如何在保护个人隐私的同时共享基因信息的讨论。
尽管如此,埃尔利希仍然担心文特尔的声望会使这篇论文在决策者眼中更具分量,他们可能会对 DNA 隐私过于担忧。“新的规则和法规都是基于这样的论文制定的,”他说。“当我们处理隐私风险时,务必确保事实正确。”
本文经许可转载,并于 2017 年 9 月 8 日首次发表。