革命延期:人类基因组计划为何令人失望

人类基因组计划迄今未能实现科学家承诺的医学奇迹。生物学家们现在对于哪里出了问题(如果有的话)以及接下来需要发生什么存在分歧

十年前,生物学家和非生物学家都对耗资30亿美元的人类基因组计划的医学前景充满乐观。在2000年夏天白宫仪式上宣布人类“生命之书”的第一份草图时,比尔·克林顿总统预测,基因组计划将“彻底改变大多数(如果不是全部)人类疾病的诊断、预防和治疗”。

一年前,时任美国国家人类基因组研究所所长,或许也是该项目最不知疲倦的热情支持者弗朗西斯·S·柯林斯,描绘了“个性化医疗”的宏伟愿景,该医疗很可能在2010年之前从该项目中涌现:届时将提供基因检测,以指示个人患心脏病、癌症和其他常见疾病的风险,随后不久将推出为个人量身定制的预防措施和疗法。

甚至在人类染色体中DNA“字母”的第一个完整序列被破译之前,一个资金雄厚的基因组学巨头——配备了强大的测序和绘图技术、蓬勃发展的数据库以及柯林斯所说的从基因组中“挖掘奇迹”的逻辑游戏——就着手识别人类重大医学灾难背后的关键基因。


支持科学新闻事业

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻事业 订阅。通过购买订阅,您正在帮助确保未来能够继续产出关于塑造我们当今世界的发现和想法的具有影响力的报道。


快进到2010年,科学界发现自己变得冷静和分裂。问题不在于基因组计划本身,它彻底改变了基础研究的速度和范围,揭示了以前被称为“垃圾DNA”的物质中隐藏的目的,甚至在我们基因组中检测到了尼安德特人DNA的痕迹。癌症研究员伯特·沃格尔斯坦呼应了一种普遍的情绪,他说:“人类基因组计划从根本上改变了我们进行科学研究的方式。”

问题在于,源于基因组计划的研究迄今未能兑现柯林斯和其他人在十年前做出的医学承诺。位于马萨诸塞州剑桥市的怀特海生物医学研究所的肿瘤生物学家罗伯特·A·温伯格表示,癌症基因组学的回报“相对 modest——与投入的资源相比非常 modest”。美国国立卫生研究院前院长哈罗德·E·瓦姆斯最近在《新英格兰医学杂志》上撰文称,“只有少数重大变革……已进入常规医疗实践”——他补充说,其中大多数是“在人类基因组揭示之前就已有的发现”的结果。杜克大学人类基因组变异中心主任大卫·B·戈尔茨坦说:“可以公平地说,我们明年不会实现常见疾病的个性化治疗。”

或许期望在短短10年内就出现奇迹是不合理的(尽管基因组项目发起人有预测)。然而,在今天的失望背后,隐藏着一个更令人不安的问题:迄今为止研究的医学影响出人意料地 modest,是否表明科学家们一直在追求错误的策略来寻找常见疾病的遗传原因?这种策略从根本上来说,涉及搜索基因DNA文本中的轻微变异,这些变异可能会共同增加个体患上常见疾病的风险。多年来,许多科学家一直在追求这样一种假设,即某些常见变异在患有特定疾病的人群中尤其普遍,并且发现这些变异将有助于理解对2型糖尿病和动脉粥样硬化等重大、生物学上复杂疾病的易感性是如何从一代人传递到下一代人的。未能找到对疾病有显著影响的基因变异是否意味着“常见变异”假说是错误的?

这个问题在医学研究界引发了裂痕。一方面,主要的基因组科学家坚持认为常见变异策略正在奏效。Broad 研究所(怀特海研究所的附属机构)主任埃里克·S·兰德表示,最近三年,识别疾病遗传线索的研究“令人震惊”,“我们甚至还没有触及常见变异的表面”。他说,医学革命将随着技术的进步而到来——即使不是为我们,也会为我们的孩子到来。换句话说,这场革命只是迟到了。

另一方面,越来越多的生物学家开始坚称,常见变异策略是有缺陷的。在今年四月发表在《细胞》杂志上的一篇备受争议的文章中,华盛顿大学的遗传学家玛丽-克莱尔·金和乔恩·M·麦克莱伦认为,“绝大多数[常见]变异与疾病没有已确立的生物学相关性,也没有用于预后或治疗的临床效用。” 英国科学界元老级人物、遗传学家沃尔特·博德默直言,研究常见变异的策略“在科学上是错误的”。

当一些基因组科学家庆祝迄今为止取得的进展时,另一些人看到同样的结果,却主要看到失败,现在他们正在问:我们接下来该怎么办?对答案的追求可能会将医学研究带入全新的途径,以理解人类疾病以及疾病如何在世代之间传递。

失望
常见变异假说在1990年代首次提出时,似乎是一个合理的赌注,它提出许多常见的人类疾病可能可以通过遗传相对少量的常见基因变异来解释。基因传统上被定义为编码蛋白质的DNA片段。这些变异可以被认为是同一基因的略有不同的、突变的文本,改变了DNA的蛋白质编码部分或附近调节基因“表达”(蛋白质合成)速率和时间的DNA。蛋白质在细胞中执行许多任务,其功能或浓度的缺陷可能会破坏分子通路,或对健康重要的相互作用链。

认为常见变异将有助于理解疾病的信念具有一定的进化逻辑。兰德说,数万年前,人类祖先的快速和近期的人口爆炸“锁定”了人类基因库中的许多变异。赌注是,这些常见变异(“常见”通常意味着在给定人群中至少出现5%)将相当容易找到,并且相对少量的变异(从几个到几十个)将塑造我们对高血压、痴呆症和许多其他广泛疾病的易感性。与疾病相关的基因变异及其编码的蛋白质,以及它们在其中发挥关键作用的途径,然后可能成为药物的潜在靶点。

然而,从一开始,这个方案就遭到了一些反对。1993年,宾夕法尼亚州立大学的进化生物学家肯尼斯·M·韦斯,从列夫·托尔斯泰的小说《安娜·卡列尼娜》中,转述了他关于家庭的名言,以阐明复杂疾病的遗传学观点:“所有健康的家庭都彼此相似;每个不健康的家庭都有其自身的不健康方式。” 韦斯和哥伦比亚大学统计遗传学家约瑟夫·D·特威利格反复提出的观点是,常见变异可能具有非常小的生物学效应;如果它们造成了强大的危害,自然选择就会阻止它们在人群中变得常见。相反,他们认为,对生物学上复杂疾病的易感性可能源于遗传了许多罕见的促病变异,在任何给定的个体中,这些变异可能达到数百甚至数千个。用托尔斯泰的话说,病人以他们自己的方式在基因上是不幸的。这个论点来自一个自称“边缘疯子”的人,并没有赢得多少支持者。

要看谁是对的,显而易见的方法是测序患病和健康个体的完整基因组,并使用强大的计算机,识别在患有给定疾病的患者中出现但在对照组中未出现的DNA变异。与过去的标准遗传研究(依赖于基于生物学的怀疑,认为特定基因在疾病中起作用)不同,这种“不可知论”的比较可能会揭示任何和所有DNA罪魁祸首,包括那些以前未被怀疑重要的罪魁祸首。但在10年前,技术上不可能采取这种方法,而常见变异假说——如果正确的话——为发现导致常见疾病的基因提供了一条捷径。

受常见变异假说指导的基因组科学家开始计划大规模研究,称为全基因组关联研究(通常称为GWAS,或“gee-waz”),该研究依赖于DNA中的地标,称为单核苷酸多态性或SNP(发音为“snips”),以揭示疾病中重要的常见基因变异。SNP发生在整个染色体中,是DNA中的位点(不一定在基因内),其中一个人的DNA中的单个代码字母可能与另一个人的DNA中相同位置的字母不同。该计划是检查大量SNP,这些SNP在人与人之间经常变化,以查看哪些版本在患有特定疾病的人群中频繁出现。统计学上与疾病相关的SNP然后将引导研究人员找到附近的基因变异(与地标一起遗传),这些变异可以解释这种关联。

然而,该计划需要组装一个图谱,就像是常见人类SNP的图谱。在过去的十年左右,生物学家收集了越来越多的SNP,以指导他们寻找疾病的遗传根源,从1998年的SNP联盟(该联盟组装了每个人类染色体上这些地标的地图)开始,发展到HapMap(该图谱编目了更大范围的SNP,称为单倍型)。在过去的五年中,全基因组关联研究已经查看了数万名个体患者和对照组的基因组中的数十万个常见SNP,以寻找与常见疾病相关的SNP。

生物学界的裂痕就发生在这里。兰德和其他人赞扬最近发现的常见、与疾病相关的SNP是通往医学重要途径的门户。诚然,最近来自大型基因组联盟的大量论文已经揭示了数百个与精神分裂症、2型糖尿病、阿尔茨海默病和高血压等疾病相关的常见SNP。弗朗西斯·柯林斯最近在PBS的《查理·罗斯访谈录》节目中声称,科学家们已经“弄清楚”了近1,000个常见基因变异“如何在疾病风险中发挥作用,我们已经利用这些信息来改变我们开发治疗糖尿病、癌症和心脏病的新疗法的整个观点”。然而,其他人指出,到目前为止,这些数据在预测疾病风险方面并没有太大用处。例如,在2型糖尿病中,分析超过10,000人的220万个SNP的关联研究已经确定了18个与该疾病相关的SNP,但根据杜克大学的戈尔茨坦的说法,这些位点总共仅解释了该疾病遗传性的6%——几乎没有因果生物学。

2008年,戈尔茨坦告诉《纽约时报》:“令人震惊的是,我们已经破解了人类基因组,并且可以查看所有常见的基因变异,我们发现了什么?几乎什么都没有。这绝对令人难以置信。” 去年夏天,戈尔茨坦谈到常见变异/常见疾病假说已经成为过去:“我们已经进入并离开了那个领域,它解释的远不如很多人想象的那么多。”

普林斯顿大学的大卫·博特斯坦对创建单倍型图谱的策略提出了大致相同的结论:“它必须被完成。如果没有尝试过,没有人会知道它不起作用。” 他说,耗资1.38亿美元的HapMap是“一次辉煌的失败”。

沃尔特·博德默是20世纪80年代最早提出基因组计划的人之一,也是主导近期基因组学的关联研究的先驱,他断言,搜索常见基因变异是一条生物学死胡同。“几乎不可能找到这些变异基因的生物学效应是什么,这绝对是关键,”他说。“绝大多数[常见]变异都没有揭示疾病的生物学机制。”

新的前进方向
目前关于常见变异假说的争论不仅仅是一场深奥的科学辩论。它至少提出了一种替代的前进方向,以解决许多人所谓的“缺失的遗传性”问题,至少在短期内是这样。例如,博德默一直敦促研究人员将目光转向罕见的基因变异。常见变异的终点和罕见变异的起点之间的界限并不精确——按照博德默的定义,“罕见”指的是在人群中发生频率为0.1%至1%或2%的特定基因突变(远低于当前大多数全基因组关联研究的分辨率)。但该假说的主要思想是,具有较大疾病相关效应的基因变异往往是罕见的,而常见的基因变异几乎总是产生可忽略不计或中性的效应。

同样的论点出现在金和麦克莱伦在《细胞》杂志上发表的争议性文章中,这篇文章在今年春天在基因组学界引起了如此多的敌意——兰德将这篇文章贬为“观点文章”。金(她发现了数百种导致家族性乳腺癌的BRCA1和BRCA2基因的罕见变异)和麦克莱伦(她也发现了许多导致精神分裂症遗传学的罕见变异)正在提出一种理解复杂疾病的“新范式”。他们认为,大多数这些疾病都是“异质的”(意味着许多不同基因中的许多不同突变可以产生相同的疾病),大多数高影响突变是罕见的,并且许多罕见的基因变异是基因库中相对较新的补充。在患者中识别出的罕见变异因此可以将研究人员引导至与特定疾病相关的特定分子通路,而对这些通路的生物学理解可以提出新的治疗干预措施。

博德默、《细胞》杂志的作者和其他人指出,海伦·H·霍布斯和乔纳森·C·科恩的工作是一个典范,说明如何使用生物学作为指导,揭示埋藏在基因组中具有医学意义的信息。霍布斯-科恩方法侧重于疾病的极端案例,假设强烈扰乱生物学的罕见基因变异是造成极端情况的原因,并且会鲜明地突出出来。他们还基于生物学知识,挑选和选择在这些人中检查哪些基因。并且,他们对特定的候选基因进行测序,寻找人与人之间细微但功能上显著的变异,而不是使用SNP关联,后者可以指示疾病相关基因的遗传邻域,但通常不是基因本身。

2000年,当基因组学领域的大新闻是生物技术公司塞雷拉基因组学创始人J·克雷格·文特尔与NIH科学家之间的竞赛,以产生人类基因组序列的第一个粗略草图时,霍布斯和科恩悄然启动了一个名为达拉斯心脏研究的项目,以帮助揭示心脏病的原因。科恩是一位南非生理学家,多年来一直研究胆固醇代谢(其合成和分解)。霍布斯接受过医学博士培训,现在是德克萨斯大学西南医学中心达拉斯分校的霍华德·休斯医学研究所的研究员,她曾在迈克尔·S·布朗和约瑟夫·L·戈尔茨坦的实验室进行研究,他们因在胆固醇代谢方面的工作而共同获得1985年诺贝尔奖,这反过来为开发流行的降胆固醇药物(称为他汀类药物)奠定了基础。

霍布斯和科恩根据生物学“直觉”设定了他们的科学方向,这代表了一种与几乎所有其他从事基因组学研究的人完全不同的策略。他们招募了大约3,500名达拉斯县居民(其中一半是非洲裔美国人),然后对他们进行了强化医学检查。他们不仅关注基因组(尽管他们尽职尽责地收集了每个人的DNA),而且还收集了许多因素的非常精确的测量值,这些因素
可能导致冠状动脉疾病:血液化学(包括胆固醇值)、代谢、体脂、心脏功能、动脉增厚(通过高科技成像评估)和环境影响。在两年多的时间里,他们编制了一个庞大而高度详细的个体身体特征数据库——遗传学家称之为“表型”。

在那之后,他们将基因组学注意力集中在具有特别显著表型的人身上——特别是高密度脂蛋白(HDL,通常称为“好”胆固醇)或低密度脂蛋白(LDL,“坏”胆固醇)的极高或极低值。他们对基因组的搜索绝不是不可知论的。正如科恩所说,“我们从更实用的角度来看待这个问题。”

正如他们在2004年《科学》杂志上报道的那样,他们首先研究了血液中HDL浓度非常低的患者,这种情况会增加患心脏病的风险。他们知道有三个基因与罕见的胆固醇代谢紊乱有关,因此他们比较了极低HDL患者和高HDL水平人群中这些基因的DNA序列,发现了几种与极度降低的HDL水平相关的罕见变异。他们还报告说,受影响基因的突变“显著贡献”于一般人群中低HDL值。

2005年,霍布斯和科恩将注意力转向达拉斯心脏研究中发现LDL水平异常低的人群。当研究人员分析了称为PCSK9的基因的DNA序列时,他们获得了基因组学上的巨大成功,已知该基因参与胆固醇代谢。使该基因沉默的两个突变与低LDL水平相关。在一项后续研究中,该研究分析了过去15年从密西西比州、北卡罗来纳州、明尼苏达州和马里兰州人群中收集的数据,霍布斯和科恩确定,在PCSK9中具有一种或另一种沉默突变的非裔美国人LDL水平降低了28%,冠心病风险惊人地降低了88%。在白人中,同一基因中的突变使LDL降低了15%,心脏病风险降低了47%。几乎没有数百项全基因组关联研究发现对疾病风险有如此大影响的基因。

制药公司已经在测试关闭PCSK9基因或扰乱该基因影响的分子通路的分子,以此作为降低LDL和降低一般人群心脏病风险的一种方法。霍布斯说,PCSK9现在是几乎每家制药公司的“十大目标”之一。

认识到常见变异方法识别的基因的微小影响,并受到霍布斯-科恩工作成功的鼓舞,同样在杜克大学的大卫·戈尔茨坦和伊丽莎白·T·西鲁利最近提出扩大对医学上重要的罕见变异的搜索。例如,一个想法是在精心挑选的人群中测序和比较整个“外显子组”。外显子组是染色体中基因的实际蛋白质编码部分(外显子)的集合,以及调节基因活性的附近区域;它不包括位于外显子或基因之间的DNA片段。西鲁利和戈尔茨坦还建议在受常见疾病影响的家庭或具有极端性状的人群中寻找这些罕见变异,在这些人群中,可以更容易地识别出显著的DNA差异。这项工作已经在许多实验室进行中。“我们每天都在实验室对外显子组进行测序,”华盛顿大学的金说。然而,外显子组测序是一种权宜之计,直到廉价、可靠的全基因组测序变得可用,可能在三到五年内。

谨防兔子洞
一些勇敢的声音正在暗示,人类生物学的兔子洞可能比关注DNA序列和蛋白质所能揭示的还要深。他们说,传统遗传学可能无法捕捉基因的分子复杂性及其在疾病中的作用。曾经被斥为“垃圾”的DNA广阔区域,现在已知隐藏着重要的调控区域。例如,一些DNA片段产生少量RNA,可以干扰基因表达。而DNA上的化学“标签”不会改变其序列——因此是“表观遗传的”——也会影响基因表达,并且可以在一生中被环境因素改变。这种环境修饰的DNA甚至可能传递给后代。

简而言之,基因的定义——更不用说具有医学意义的基因了——现在被多层复杂性所困扰。曾经被认为是基因和性状之间直接的、单向的、点对点的关系,现在已经变成了“基因型-表型问题”,其中了解DNA的蛋白质编码序列只告诉我们性状是如何形成的。一部分。

在动物实验中,西雅图系统生物学研究所的科学发展主任约瑟夫·H·纳多追踪了100多种受表观遗传变化影响的生化、生理和行为特征,并看到其中一些变化传递了四代。“这完全是拉马克式的!”他笑着说,指的是18世纪生物学家让-巴蒂斯特·拉马克的观点,即后天获得的性状可以遗传。

似乎这种复杂程度还不够,纳多有实验证据表明,一个特定基因的功能有时取决于围绕它的特定基因变异组合——这种整体效应为疾病的遗传解释引入了语境化的后现代皱纹。纳多说,这表明一些常见疾病最终可能追溯到网络或通路中的大量基因,这些基因的影响可能因人拥有的基因变异而异;例如,一种基因变异的存在可能会加剧或抵消该组中另一种疾病相关基因的影响。“我的猜测是,这种非常规的遗传方式将比我们预期的更常见,”纳多说。

纳多提出的这些方面在疾病中究竟有多强大仍不清楚。与此同时,新一代快速、廉价的测序技术将很快使生物学家能够比较整个基因组,到那时,常见变异与罕见变异的争论可能会消退到古代历史中。目前的缺失遗传性难题远没有给该领域蒙上阴影,甚至像金这样的常见变异怀疑论者也对未来几年感到兴奋。“现在我们有了适当解决这些问题的工具,”她说。“想象一下达尔文和孟德尔用这项技术能做什么。现在是从事基因组学研究的绝佳时机。” 然而,这一次,没有人预测医学奇迹的时间表。

Stephen S. Hall是一位屡获殊荣的科学作家和定期撰稿人。他是《智慧:从哲学到神经科学》(克诺夫出版社,2010年)的作者,这是他最近的作品。

更多作者 Stephen S. Hall 的文章
大众科学 Magazine Vol 303 Issue 4本文最初以“革命延期:人类基因组计划为何令人失望”为题发表于大众科学 Magazine Vol. 303 No. 4 ()
doi:10.1038/scientificamerican102010-svJMiRcAI0xI1bP7RyMJW
© . All rights reserved.