功能之争:科学家们在ENCODE基因数据的意义上发生冲突

ENCODE,人类基因组计划耗资1.85亿美元的后续项目,承诺揭示关于我们DNA的新细节。但争议持续存在,因为遗传学家们仍然在一个小小的“f”词——“功能”上存在分歧。

在人类基因组计划完成十二年后,它的后续项目以一个庞大的数字引起了轰动:领导DNA元素百科全书(ENCODE)项目的研究人员表示,大约80%的人类基因组是“功能性的”。他们的说法立即引来了生物学家的批评,许多人表示,从进化角度来看,基因组中如此多的部分真正为人类健康发挥作用是不可能的。

七个月后,争议仍在继续。几篇期刊和无数博客发表了关于此事的评论文章。当代生物学在4月8日发表了第二篇相关文章。在二月底,基因组生物学与进化期刊发表了一篇异常尖锐的评论,因将ENCODE比作苹果地图而引起了一些关注,苹果地图在iPhone 5上的发布遇到了问题。一个词——功能——的含义怎么会如此具有争议性?

ENCODE由美国国立卫生研究院的国家人类基因组研究所资助,旨在处理NIH人类基因组计划产生的数据,该计划确定了构成人类DNA的化学碱基序列——腺嘌呤、胞嘧啶、胸腺嘧啶和鸟嘌呤,即A、C、T和G序列。一些碱基组合拼写出制造特定蛋白质的密码,蛋白质在细胞中完成大部分工作,但科学家们不知道大部分碱基序列的作用是什么。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


98%

因此,ENCODE测试了基因组的几乎每个部分,特别是未参与蛋白质编码的98%部分,寻找它们在身体中发挥什么作用的线索。下一步非常重要,因为科学家们确信,98%中的某些部分充当调节器,告诉蛋白质制造者何时、何地以及产生多少。这样的工作对于正常的细胞行为至关重要,但科学家们只了解一些具体的例子。他们不知道是否有比已经发现的更多的调节器,或者如果存在其他调节器,它们是如何工作的。这些调控区域可能有助于解释许多似乎是遗传的但又与特定蛋白质编码基因没有直接关联的疾病的基础。

2012年9月,ENCODE的领导者正式结束了该项目的主要研究阶段。他们发表了数十篇同行评议的论文,包括自然杂志上的主要论文,该论文称基因组的80%是功能性的。与此同时,他们发布了一个数据库,注释了大部分非蛋白质编码基因组,并附有关于其化学性质的注释。注释本质上是这样说的:“这部分结合了一个蛋白质”;“这部分经常被甲基标记”;以及“这部分通常被收起来,缠绕在一个叫做组蛋白的蛋白质周围。”(大众科学是自然出版集团的一部分。)

大部分强烈反对并非针对ENCODE创建的功能部分数据库。“ENCODE项目为科学界提供了大量有用的数据,这些数据正在世界各地被使用,”牛津大学基因组学研究员Chris Ponting说,他不同意ENCODE关于功能性DNA的一些结论。相反,主要的批评是该项目的首席科学家在他们的结论中越界了,尤其是在宣传人类基因组的大部分可能对人类生命是必要的这一观点时。批评者说,这些结论并没有得到ENCODE所做科学研究的支持,并且向公众提供了关于遗传学和进化如何运作的不准确概念。

问题来自于ENCODE寻找DNA中化学活性部分,并将这些部分称为“功能性”的事实。然而,并非所有这些活性都必然对人类生命重要。例如,ENCODE科学家寻找与蛋白质结合的DNA区域,因为这种结合对于打开、读取和标记DNA至关重要。但是一个区域也可能在不影响人类健康的情况下结合蛋白质。人类基因组充满了从我们进化史中的病毒中获得的DNA。不伤害或帮助宿主的序列可能仍然包含与蛋白质结合或做其他事情而不影响细胞功能的区域。

调控启示

ENCODE不可避免地记录了一些区域为活性和功能性的,但这些区域可能在身体中没有任何重要的作用。ENCODE对功能性的定义与某些区域可能重要的原因或这些区域究竟在为人类健康做什么无关,华盛顿大学西雅图分校的基因组学研究员和ENCODE的高级科学家之一John Stamatoyannopoulos说。

然而,他和一些其他生物学家认为,ENCODE的80%结论可能为人类基因组提供一种新的视角。Stamatoyannopoulos说,基因组中如此多的部分具有生物化学活性这一事实表明,基因组中可能比以前认为的更多的部分是调控性的。“我只是认为这种调控网络的复杂性将继续增加和扩展我们的思维,”西奈山伊坎医学院的遗传学家Eric Schadt说,他没有参与ENCODE。“我认为我们将看到基因组的绝大部分可以在其中发挥作用。”

活跃但不重要

批评者强调,ENCODE并非旨在测试非蛋白质编码基因组中有多少部分在为人类健康做重要的事情。他们说,在没有首先进行实验来确切显示新发现的“功能性”区域如何影响身体的情况下,说科学已经学到了一些新的和革命性的东西是不负责任的。

ENCODE的领导者描绘了一幅人类基因组的图景,其中大部分部分都被有效地利用了,批评者说,这不是看待它的正确方式。“区分以下几点很重要:人类基因组是一台完美的机器吗?所有可能基因组中最好的?还是它是一团糟?”霍华德·休斯医学研究所的珍妮莉亚农场研究园区基因组学研究员Sean Eddy说,他曾帮助规划ENCODE。“我们对基因组的了解更符合它是一团光荣的混乱。”

Eddy所说的“混乱”指的是来自进化数学模型的结论,这些模型表明,即使化学活性,至少85%到90%的基因组也一定对人类健康不重要。部分原因是,随着时间的推移,会产生如此多的随机突变,如果大部分基因组如此重要,以至于突变会对健康产生重大影响,那么人类早就灭绝了。另一方面,Stamatoyannopoulos和Schadt说,这些模型,其中一些模型依赖于自1960年代以来就存在的简单方程式,可能已经算错了数字。 Eddy说,这有可能,但科学家们应该在否定这些模型之前,提出更好的论据来反对这些模型。

不要指望很快会有解决方案。毕竟,辨别哪些DNA对于人体来说是必需的和非必需的是很困难的。Eddy说,对基因组的任何改变,无论多么微小,都可能对整个生物体产生一些影响——一种DNA的蝴蝶效应。功能存在于一个连续体上,不同的科学家可能会在未来几年内对其进行不同的定义。

© . All rights reserved.