基因检测的巨大飞跃:评估心脏病、乳腺癌及其他疾病的风险

这种预测医学的新方法以风暴之势席卷基因组学研究,但仍存在争议

660万——这就是 Sekar Kathiresan 在人类基因组上寻找的点位数,用于计算一个人患冠状动脉疾病的风险。Kathiresan 发现,在这些选定位置上,人与人之间单个 DNA 字母差异的组合可能有助于预测某人是否会死于全球主要死因之一。没有人知道这些 A、C、T 和 G 中的大多数在做什么。然而,Kathiresan 说,“你可以根据你出生时就已确定的东西,将人们划分为清晰的心脏病发作轨迹。”

Kathiresan 是波士顿马萨诸塞州总医院的遗传学家,他并不是唯一一个计算出惊人数量变异的人。他开发的多基因风险评分是寻找常见疾病遗传因素的前沿方法的一部分。在过去的二十年中,研究人员一直在努力解释包括心脏病、糖尿病和精神分裂症在内的疾病的遗传性。多基因评分将基因组上数万至数百万个位点的微小(有时是无限小的)贡献加在一起,以创建迄今为止一些最强大的基因诊断方法。

这种方法之所以能够兴起,归功于许多资源充足的队列研究和大型数据存储库,例如英国生物样本库(参见第 194 页、203 页和 210 页),这些研究收集了来自数十万人的大量健康信息以及 DNA 数据。过去一年左右发表的一些研究通过整合来自这些来源的信息,能够分析超过一百万的参与者,从而提高了科学家检测微小效应的能力。


支持科学新闻事业

如果您喜欢这篇文章,请考虑支持我们屡获殊荣的新闻事业,方式是 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


支持者表示,多基因评分可能是基因组医学的下一个巨大进步,但这种方法也引发了相当大的争议。一些研究提出了关于如何使用这些评分的伦理难题:例如,在预测学业成绩方面。批评者还担心人们将如何解读从测试中出现的复杂且有时模棱两可的信息。而且,由于主要的生物样本库缺乏种族和地域多样性,目前的基因筛查工具可能仅对数据库中代表的人群具有预测能力。

英国牛津大学的遗传学家马克·麦卡锡说:“大多数人都热衷于就此进行认真的辩论,因为它引发了各种后勤、社会和伦理问题。”即便如此,多基因评分正迅速走向临床,并且至少有一家美国公司已经向消费者提供。

澳大利亚昆士兰大学的遗传学家彼得·维舍尔是该趋势背后方法的先驱,他对这种方法持 broadly 乐观态度,但仍然对进展的速度感到惊讶。“我绝对相信这种情况会比我们想象的来得更快,”他说。

风险计算

当研究人员在 2000 年代初期完成人类基因组的第一个草图时,许多人预计这将标志着医学革命的开始。遗传学家开始寻找可能解释为什么一个人会患上糖尿病或心脏病而另一个人不会患病的原因的差异。这个想法很简单:将一组患有该疾病的人与一组没有该疾病的人进行比较,并寻找他们 DNA 中的差异。这些变异通常以 DNA 字母交换的形式出现,称为单核苷酸多态性或 SNP。如果患有某种疾病的人在某个位置倾向于有 T,而其他人有 C,则表明该 SNP 在某种程度上与该疾病相关。

这些全基因组关联研究——或 GWAS,正如它们后来为人所知的那样——变得非常流行。但是,经过多年的搜索,科学家仍然只能解释常见疾病遗传风险的一小部分。加利福尼亚州拉霍亚斯克里普斯研究所的遗传学家阿里·托卡马尼说,事实证明,大多数这些疾病与比科学家最初预期的更多的 SNP 相关。

更糟糕的是,大多数变异带来的风险非常小——只有在调查大量人群时才能检测到。“我们没有足够的样本量来真正像某些人天真地认为的那样推动预测,”英国欣克斯顿欧洲生物信息学研究所所长伊万·伯尼说。到 2007 年,遗传学家们开始担心他们所谓的“缺失的遗传性”。很明显,许多这些疾病都具有遗传成分,但 GWAS 显然没有捕捉到太多。

今天,情况正在发生变化。Kathiresan 说,随着可以访问海量数据集以及数据分析方法的进步,科学家们越来越擅长衡量那些非常小的风险。

Kathiresan 用来生成他的 660 万 SNP 评分的技术就是一个很好的例子,该评分于 8 月份发布。他和他的团队使用了 2015 年荟萃分析的数据,该分析整合了 48 项 GWAS,包括 61,000 名冠状动脉疾病患者和 120,000 名对照组。然后,他们在英国生物样本库的 290,000 人身上测试了他们的多基因预测因子,发现得分最高的几个百分位的人平均患该疾病的风险是其余人口的几倍(参见“多基因预测工具”)。例如,在获得最高评分的 23,000 人中,7% 患有冠状动脉疾病,而其余人口中只有 2.7%。该小组对其他四种疾病(包括炎症性肠病和乳腺癌)进行了类似的分析,每次都识别出一组得分在最高几个百分位且风险特别高的人群。

该论文受到了一些研究人员的赞扬,认为它证明了多基因风险评分在理论上可以用于临床。Kathiresan 说,评分识别高风险人群的能力与医学中使用的现有风险衡量标准相似。“本质上,你拥有的是冠状动脉疾病的一种新的风险因素。”

Kathiresan 的工作成为头条新闻并引发了一些争议——原因是风险评分中包含的变异数量巨大。巴尔的摩马里兰州约翰霍普金斯大学彭博公共卫生学院的生物统计学家尼兰詹·查特吉说,在这 660 万个 SNP 中,只有一小部分实际上对预测做出了贡献,他没有参与这项研究。这是因为这些类型的评分是如何计算的:所有变异的数据都被输入到一个算法中,该算法根据每个变异与疾病的关联程度为其分配权重,而大多数变异实际上带来的风险很小或可以忽略不计。

包括查特吉在内的许多研究人员表示,包含许多效果极小的变异无关紧要。但其他人担心,包含数百万个没有任何作用的变异可能会破坏公众对评分的信任。佐治亚州亚特兰大埃默里大学的流行病学家塞西尔·扬森斯说,她对这项研究并不印象深刻。她担心的问题之一是,与仅由与疾病联系最紧密的 74 个 SNP 组成的评分相比,用于计算最终评分的数百万个变异并没有显着提高性能。她说,如果这些类型的评分要用于临床,“评分的可信度也很重要。”

行动方案

虽然 Kathiresan 的研究主要关注遗传风险,但其他人正在研究多基因评分如何补充现有的风险衡量标准。2013 年,赫尔辛基大学的统计遗传学家萨穆利·里帕蒂发现,将多基因风险评分与冠状动脉疾病的传统风险因素(如高体重指数和高血压)相结合,可以提高对谁会患上该疾病的预测。他还能够识别出一组遗传风险评分高但在其他方面仅被认为是中等风险的人,里帕蒂说,这种挑出那些在雷达下飞行的人的能力是多基因风险评分的最大好处。

基因风险评分还可以改进乳腺癌等疾病的筛查方案。在美国,目前建议女性从 50 岁开始进行乳房 X 光检查,但如果能够识别出更年轻的高危女性,她们可能会从更早的筛查中受益。2016 年,查特吉开发了一种乳腺癌模型,该模型结合了传统风险因素和从大约 90 个 SNP 计算出的多基因评分。根据这些评分,他预测 40 岁女性中有 16% 的风险相当于平均 50 岁女性——这表明她们可以从 40 岁开始接受筛查。该团队现在正在其他数据集和更大数量的 SNP 中测试其模型,以查看预测是否成立。

与此同时,位于犹他州盐湖城的个性化医疗公司 Myriad Genetics 已经开始在其为某些女性提供的结果中包含乳腺癌的多基因风险评分。只有大约 10% 的有乳腺癌家族史的女性携带与该疾病相关的有害单基因突变,因此该公司现在向其余 90% 的女性返回一个评分,该评分根据多基因风险以及病史和生活方式等因素告知她们患乳腺癌的可能性。Myriad 的首席科学官杰瑞·兰奇伯里说,这些评分的优势之一是它们为每个人都提供了结果。虽然目前的重点是识别高风险女性,但在未来,他可以看到这些评分被用于寻找那些风险低于平均水平的人,这些人可能会从较不频繁的乳房 X 光检查中受益。“我们开始进入一个可以为每个人提供精准医疗结果的世界,”兰奇伯里说。

一切都在统计中

对多基因评分的一个抱怨是,它们抛弃了生物学而偏爱统计学。多基因评分本身不会为药物开发提供太多见解,但这些研究可以为深入研究个体变异并找出它们影响哪些基因以及可能导致疾病的机制提供起点。

这种见解的一部分将来自理清哪些变异实际上产生了给定的性状或疾病,哪些只是随波逐流。与疾病相关的 SNP 不一定是其原因:它可能仅仅是该变异倾向于与直接相关的基因组另一部分一起遗传。例如,Kathiresan 估计,在他的 660 万个 SNP 中,只有大约 6,000 个与冠状动脉疾病有因果关系。麦卡锡说,随着样本量越来越大,将这些变异区分开来变得更容易。

当前的研究仍然无法解释很大一部分遗传风险。里帕蒂估计,许多常见疾病的风险中有 30-50% 是遗传性的——其余大部分由环境因素决定。但缺失的遗传性问题仍然存在:根据经验法则,GWAS 目前可以解释大约三分之一到三分之二的疾病遗传风险,维舍尔说。托卡马尼说,随着样本量越来越大,研究人员可能会发现更多导致风险的变异,尽管回报会减少。“在某个时候,你将不再从额外的遗传风险因素中获得太多效用,”他说。维舍尔补充说,全基因组测序也可能会发现更多的遗传风险。目前,GWAS 研究主要使用仅对基因组一部分进行测序的阵列进行,但随着全基因组测序变得更便宜和更普及,可能更容易找到导致疾病的较不常见的变异。

从实验室到临床

Kathiresan 说,他希望在明年将冠状动脉疾病的评分推向市场。但大多数研究人员承认,在这些评分可以广泛使用之前,还有障碍需要克服。麦卡锡说,首要障碍是将它们应用于不同人群。风险评分是在主要由欧洲血统的人组成的数据集中生成和验证的,例如英国生物样本库,这限制了它们应用于其他种族人群的程度。例如,Myriad 的评分目前仅适用于具有欧洲背景的个人,尽管兰奇伯里表示该公司正在开发针对非裔美国女性的类似评分。麦卡锡说,最终目标是生成特定于种族的风险评分。

伯尼补充说,种族不是唯一的复杂因素。研究中分析的人群来自特定的医疗保健系统,他们的经验不一定能跨越国界。例如,在英国和美国之间,心脏病发作的机会可能会有所不同,护理标准也可能有所不同。因此,评分可能无法转化。

即使是将这些评分传达给人们的简单行为也带来了一些担忧。麦卡锡说,医生不一定接受过遗传学方面的培训,“地球上没有足够的遗传咨询师”来进行遗传风险评分将需要的细致讨论。伯尼说,人们普遍存在一种误解,即因为我们的基因不会改变,“它在某种程度上是一种注定要实现的命运”。扬森斯担心,如果人们认为患病的机会是硬编码在他们的 DNA 中的,他们就不会有动力为此做任何事情。

对于可能被此类评分预测的非疾病性状,这种担忧变得更加尖锐。今年早些时候发表的一项针对超过 100 万人的研究开发了一种多基因评分,该评分基本上与人们接受教育的时间长短相关。该研究的作者竭尽全力澄清,他们并没有建议对得分极低的人进行任何形式的干预。“对这项或类似研究的任何实际响应——个人或政策层面——都将是非常不成熟的,”他们写道。

Geisinger Health System 的生物伦理学家兼该研究的合著者米歇尔·迈耶说,该评分根本不具有可操作性。如果不了解评分所代表的生物学差异——或与这些差异相互作用的环境和社会因素——就不可能知道如何干预。

谈论遗传学

了解人们将如何对多基因评分做出反应是研究人员的首要任务。里帕蒂和他的同事已向芬兰的 7,000 多人提供了有关他们患心脏病的可能性的信息,这些信息基于多基因评分和传统风险因素(如高血压)。里帕蒂说,大多数受访者表示,获得这些信息会激励他们做出积极的改变。初步结果表明,遗传风险高的人最有可能采取诸如减肥或戒烟之类的行动。

在附近的爱沙尼亚,研究人员正在对 100,000 人进行基因分型,这增加了该国已经采样的 50,000 人。与许多其他生物样本库不同,爱沙尼亚项目的参与者可以注册接收反馈。返回给他们的结果包括 2 型糖尿病和心血管疾病的多基因风险评分,爱沙尼亚塔尔图大学爱沙尼亚基因组中心的遗传学家莉莉·米拉尼说。与芬兰的工作类似,参与者会看到生活方式改变如何降低或增加他们风险的图表。米拉尼说,初步迹象表明,人们很高兴获得这些建议。

目前,人们正在从遗传咨询师那里获得他们的评分。但米拉尼正在与爱沙尼亚政府合作,研究如何将基因组数据整合到医疗保健系统中,以便医生每天都可以使用它。米拉尼说,该国的最终目标是对任何有兴趣的人进行基因分型,直至其全部 130 万人口。“目标是建立一些非常伟大的东西,让所有医生都想推荐它,所有人口都想要它。”

本文经许可转载,并于 2018 年 10 月 10 日首次发表

First published in 1869, Nature is the world's leading multidisciplinary science journal. Nature publishes the finest peer-reviewed research that drives ground-breaking discovery, and is read by thought-leaders and decision-makers around the world.

More by Nature magazine
© . All rights reserved.