一位密码学家和一位遗传学家走进一间研讨室。一个小时后,在听完密码学家的演讲后,遗传学家拿着一张写满潦草字迹的餐巾纸走近他。密码学家皱了皱眉头,然后点了点头。近两年后,他们揭示了他们共同努力的成果:一种无需真正看到任何人的基因就能找到有害突变的算法。
斯坦福大学的密码学家 丹·博内 和遗传学家 吉尔·贝赫拉诺 以及他们的学生的目标是保护分享其基因数据的患者的隐私。快速且经济的基因组测序已经 启动 了 一场革命,在 个性化医疗 领域,使医生能够精准定位疾病的病因并提出量身定制的解决方案。挑战在于,此类比较通常依赖于检查许多不同患者的基因,包括来自无关机构和研究的患者。做到这一点的最简单方法是让护理人员或科学家获得患者的同意,然后将每个基因的每个字母发布到 匿名数据库 中。这些数据通常受许可协议和受限注册保护,但最终防止其被共享、去匿名化 或滥用的唯一因素是用户的良好行为。理想情况下,研究人员(例如,被黑客攻击或加入保险公司的研究人员)泄露数据不仅应是非法的,而且应该是不可能的。
当患者分享他们的基因组时,管理数据库的研究人员面临着艰难的选择。如果向社区公开整个基因组,患者将面临未来 歧视 的风险。例如,雷迪儿童基因组医学研究所的首席执行官斯蒂芬·金斯莫尔遇到许多不愿将其基因组与生病的孩子进行比较的军人父母,他们担心如果军方得知有害突变,他们会被解雇。另一方面,如果科学家只分享基因组的摘要或有限片段,其他研究人员可能难以发现疾病遗传中的关键模式,也难以查明个别患者健康问题的遗传原因。
支持科学新闻
如果您喜欢这篇文章,请考虑订阅我们屡获殊荣的新闻报道来支持我们 订阅。通过购买订阅,您正在帮助确保有关当今塑造我们世界的发现和想法的有影响力的故事的未来。
博内和贝赫拉诺承诺使用一种称为安全多方计算 (SMC) 的密码学概念来实现两全其美。实际上,这是一种解决“百万富翁问题”的方法——一个假设的情况,其中两个人想确定谁最富有,而无需透露他们的净资产。SMC 技术非常适合这种推测性示例,但除了一个 丹麦甜菜拍卖,它们几乎从未投入实践。斯坦福大学小组的工作,上周在《科学》杂志上 发表,是首次将这种令人难以置信的技术应用于基因组学的成果之一。新算法允许患者或医院保持基因组数据的私密性,同时仍然与遥远的研究人员和临床医生合作,以发现与疾病相关的突变——或者至少这是希望。为了得到广泛采用,新方法将需要克服通常使密码学创新蒙尘的相同实用障碍。
隐藏和寻求的答案
直觉上,博内和贝赫拉诺的计划似乎很荒谬。如果有人能看到,他们就可以泄露它。他们怎么能从他们看不到的基因组中推断出任何东西?但是密码学家多年来一直在努力解决这类问题。“密码学让你做很多事情,比如 [SMC]——隐藏数据并且仍然对数据进行操作,”博内说。当贝赫拉诺参加博内关于密码学最新进展的演讲时,他意识到 SMC 非常适合基因组隐私。
斯坦福团队与基因组学相结合的特定 SMC 技术被称为姚氏协议。例如,假设爱丽丝和鲍勃——密码学家想象中 始终存在 的人物——想要检查他们是否在基因X 中有共同的突变。在姚氏协议下,爱丽丝(只知道她自己的基因组)写下她和鲍勃基因的每种可能组合的答案。然后,她将每个答案加密两次——类似于将其锁定在两层门后——并与鲍勃合作,通过巧妙地安排一个用于导航的密码学分叉路径花园来找到正确的答案。
她设置了与她的基因可能性对应的外层“门”。称它们为“爱丽丝门”:如果鲍勃进入 3 号门,他在里面找到的任何答案都将假定爱丽丝具有遗传变异 3。在每个爱丽丝门后面,爱丽丝添加了第二层门——“鲍勃门”——对应于鲍勃基因的选择。每个门的组合都引向爱丽丝和鲍勃基因对应对的答案。然后,鲍勃只需获得正确的“钥匙”(本质上是密码)即可解锁门。通过打乱门的顺序并仔细选择谁能看到哪些钥匙和标签,爱丽丝可以确保鲍勃能够解锁的唯一答案是正确的答案,同时仍然防止她自己了解鲍勃的基因,反之亦然。
使用这个过程的数字等效物,斯坦福团队演示了三种不同的隐私保护基因组分析。他们在患有四种罕见疾病的患者中搜索最常见的突变,在所有情况下都找到了已知的致病基因。他们还通过将婴儿的基因组与其父母的基因组进行比较来诊断婴儿的疾病。也许研究人员最大的胜利是通过让两家医院在其基因组数据库中搜索具有相同突变的患者来发现一种以前未知的疾病基因。在所有情况下,患者的完整基因组都从未离开其护理提供者的手中。
可能性的证明
挪威癌症登记处主任 吉斯克·厄尔辛 表示,除了患者的益处之外,将基因组保密还将大大缓解那些基因组数据库管理者的担忧,他们担心数据泄露对信任的影响。“我们[必须]始终保持稍微多一点的神经质,”她说。基因组隐私同样为“二度和三度亲属,[他们]共享很大一部分基因组”提供了帮助,贝赫拉诺的学生、本文的第一作者之一卡蒂克·贾加迪什指出。贝赫拉诺进一步指出,当基因组学家发现与其工作无关的有害突变时,他们面临着难题。如果大多数基因保持隐藏状态,那么基因组学家必须扫描或与患者讨论哪些突变的道德问题就不会出现。
贝赫拉诺认为 SMC 技术使基因组隐私成为一种切实可行的选择。“从某种意义上说,这是一种政策声明。它说,‘如果你既想保持基因组的私密性,又想将其用于自身利益和他人的利益,你可以。你应该要求给你这个机会。’”
其他研究人员和临床医生,尽管同意该技术在技术上是合理的,但担心它在实践方面面临着一场艰苦的斗争。哥伦比亚大学计算机科学和计算生物学助理教授亚尼夫·埃利希预测,这项技术最终可能会像 PGP(“相当好的隐私”)加密一样。尽管它作为一种加密电子邮件的工具具有技术优势,但 几乎没有人 使用 PGP——主要是因为密码学通常很难使用。可用性是医疗从业者特别关心的问题:几位人士呼应了埃利希的观点,即他们的首要任务是尽快诊断和治疗疾病,这使得过程中的任何摩擦都无法容忍。“作为工具箱中的工具,它很棒,”埃利希说,“但我的感觉……是该领域并没有朝着这个方向发展。”
金斯莫尔、埃利希和其他人也对该论文的方法是否能解决研究和临床界关注的一些实际问题持怀疑态度。例如,他们认为很难将其直接应用于肿瘤学,在肿瘤学中,基因组主要与详细的医疗和症状记录结合使用。
尽管如此,金斯莫尔和埃利希确实看到了一些用更广泛的基因组共享来取代当今笨重的数据管理机制的潜力。无论如何,贝赫拉诺的结论不是基因组隐藏注定会发生,而是这是一种技术上的可能性。“你可能会认为我们别无选择:如果我们想使用数据,就必须公开数据。” 现在我们知道事实并非如此,接下来该怎么做取决于社会。