数据库遭黑客入侵引发关于基因隐私的辩论

专家敦促提高透明度并制定新法规以保护DNA捐赠者

将匿名测序数据库中的人类基因组与其现实世界中的对应物联系起来,原本不应该成为可能。

麻省理工学院怀特黑德生物医学研究所的遗传学家雅尼夫·埃利希 (Yaniv Erlich) 显然没有收到备忘录。最终,他和麻省理工学院的本科生梅丽莎·吉姆雷克 (Melissa Gymrek) 只需一台计算机和互联网连接,就破译了50个人的身份,他们的DNA可以在免费访问的在线数据库中找到。

埃利希和吉姆雷克从“千人基因组计划”中选择了32个男性基因组,该计划拥有一个公开访问的数据库,旨在帮助研究人员找到与不同人类疾病相关的基因。接下来,埃利希和吉姆雷克使用一种算法从DNA序列中提取遗传标记。该算法专门用于识别男性Y染色体上的短串联重复序列 (STR)。Y-STR 以父系方式遗传,从一代到下一代几乎没有变化。它们提供了一种将匿名基因组与特定家族姓氏联系起来的方法。


支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。 通过购买订阅,您正在帮助确保有关当今世界发现和塑造我们世界的想法的重大故事的未来。


研究人员使用数据库中包含的匿名基因组的元数据,将可能的DNA匹配范围缩小到10,000名特定年龄的男性,他们在捐赠DNA时居住在犹他州。然后,埃利希和吉姆雷克将基因组插入到两个最流行的网络家谱网站 Ysearch 和 SMGF 中。这些娱乐网站可以免费访问将 Y-STR 标记与姓氏联系起来的数据库。研究人员发现,他们的八个样本与犹他州摩门教家庭的姓氏高度匹配。埃利希和吉姆雷克的发现发表在1月17日的《科学》杂志上。

结果表明,一个配备公开访问信息的好奇方不仅可以将一个30亿位长的基因组直接与个人联系起来,还可以使用同一DNA的片段来识别原始基因捐赠者的远亲,无论是男性还是女性。埃利希说:“如果你的第四代表亲参与了这个数据库,我们可以用它来了解你的祖先。”

虽然过去在族谱数据库中也出现了关于公开访问基因组数据的隐私问题,但这是第一次有人在没有捐赠者DNA作为参考的情况下,将匿名DNA序列与其捐赠者联系起来。

基因组挖掘可能会给DNA捐赠者带来严重的后果。根据联邦法律,健康保险公司不能使用基因数据,但目前没有任何法律禁止公司使用一个人的基因组来定义人寿保险政策或确定长期残疾护理。这项新的研究促使美国国立卫生研究院 (NIH) 从联邦资助的基因数据库(如“千人基因组计划”)中隐藏人们的年龄,这些数据库允许科学家公开访问。

然而,乔治敦大学医学教授、世界卫生组织公共卫生法和人权合作中心主任劳伦斯·戈斯廷 (Lawrence Gostin) 表示,美国国立卫生研究院的策略可能没有抓住重点。他说:“这并不是解决该问题的长期方案,因为事实上,没有什么比你的基因组更能代表你个人身份了。”

虽然只有有天赋的遗传学家才能像埃利希那样破解基因组,但随着计算变得更加复杂,以及更多数据的可用,这种可能性会越来越大。

埃利希说,开放访问的基因数据库对医学研究做出了巨大贡献。只有通过研究不同人群,科学家才能检测出影响一个人对心脏病和糖尿病等疾病易感性的DNA变异。埃利希说,诸如头发和眼睛颜色、面部特征和年龄等识别特征对这些数据的有用性贡献很大。他说,确保完全隐私意味着限制使用可能用于识别受试者的信息。

戈斯廷和埃利希都认为,最现实和务实的行动方针是提前告知人们隐私风险,以便他们可以就是否参与做出明智的决定。

约翰·霍普金斯大学伯曼生物伦理学研究所的生物伦理学和公共政策教授杰弗里·卡恩 (Jeffrey Kahn) 说:“如果无法保证隐私,那么重点应该转移到减轻数据误用的问题上。” 卡恩说,美国卫生与公众服务部 应该加强其关于共享人类受试者研究数据的法规。目前,联邦保护仅适用于由少数联邦机构资助的研究。卡恩说,这意味着个人或公司可能会在某些在线测序数据库中利用某人的基因信息,而无需担心法律后果。

拟议的修改将为所有联邦支持的人类研究项目提供保护,并使追踪滥用情况变得更容易。他说:“所有基因信息本质上都是可识别的。但这并不意味着对于滥用这些信息的人和公司不应该有相应的后果。”

 

© . All rights reserved.