本文发表在《大众科学》的前博客网络中,反映了作者的观点,不一定代表《大众科学》的观点
参与人类基因组计划的政府和机构联盟应该致力于完成已完成的基因组。我们最近的实验表明,最后这些部分可能包含对我们的健康重要的基因和其他元素。1
2003年4月,人类基因组被宣布完成,但仔细阅读会发现,实际的说法是基因组“在几乎所有功能方面都是完整的”或“尽可能地完整”。2 据估计,这意味着完成了 99%,自 2003 年以来的重点是获取更多基因组,而不是完成我们最后 1% 的基因组。但是,如果这最后 1% 是“功能性的”,并且我们还遗漏了估计的 20,000 到 25,000 个基因中的 1%3,或者 200 多个基因呢?完成基因组最重要的原因在于,任何这些“缺失”的基因都不会被研究。
最后 1% 没有完成的原因是因为它真的很难。它主要由重复序列组成,比如 CAG-CAG-CAG-CAG-CAG-CAG...,这些序列会持续数百万个 DNA 字母。这使技术和软件感到困惑,而我们已经克服了这一点。最后 1% 很重要的原因是,我们发现,在所有那些困难的重复部分之间,存在着未被发现的基因,其中一些我们现在已经找到了。所有含有基因的序列都会进入一个叫做“参考基因组”的东西,4 这就是每位科学家用来研究和尝试寻找疾病或性状的遗传因素的东西。如果一个基因不在参考基因组中,它就永远不会被研究。因此,我们的发现将使许多其他人能够研究它们。还有一些人认识到真正完成人类基因组的必要性,有些人已经成功地将大型克隆定位(映射)到高度重复的区域。我们的方法绕过了映射步骤的需要,直接进入下一代序列。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保关于当今塑造我们世界的发现和想法的有影响力的故事的未来。
关于自然有一点,它是高效的,所以这些重复区域的存在是有原因的(即使我们还不知道它是什么),而且这些基因也有其功能(同样,即使我们还不知道该功能是什么,或者当基因被破坏时会发生什么)。关于这剩余部分的重要性仍然存在争议,有时被称为“垃圾 DNA”或“暗物质 DNA”。但我认为,目前盛行的科学观点是,基因组的其余部分,即基因间(基因之间)区域很重要,并且包含其他重要的东西,但我们尚未弄清楚有关这些区域的太多信息。
基因组中这些缺失的大部分片段可能位于我们染色体的中心和末端,称为着丝粒和端粒。5,6 这些区域在 DNA 复制(细胞分裂)和基因保护中发挥着重要作用。并且已知它们是某些疾病的一部分。这些端粒主要由重复序列组成,科学家们已经注意到,随着细胞老化或在某些癌症中,这些序列会缩短。因此,许多科学家认为它们的存在是为了起到缓冲作用,这样,随着年龄的增长而发生的侵蚀不会破坏任何基因。首先,如果其中存在基因(我们现在已经发现了),它们可能会在衰老(和老年疾病)中发挥作用。其次,迄今为止,所有小组都研究了一种 6 个字母长的重复序列 (GGGTTA),但是,根据我们的实验,我们发现了 5 个字母长的序列(AATGG 和 GTGGA),其丰度比经常研究的 6 个字母序列高 150 倍。因此,我们认为,现在我们可以查看正确的位置,或许可以更好地解释对衰老和老年疾病(如癌症)的理解... 同样,在“发现”这些缺失的部分之前,无法对它们进行研究。
现在是时候重新致力于完成基因组了。测序技术已经变得更好,并且像我们的方法这样的“棘手”实验方法可以提供帮助。如果其中一个未发现的基因真的很重要,但没有人关注它怎么办?我们越早真正完成人类基因组,就越早能够真正地利用它,为了理解和健康。
参考文献
基因组遗留物:识别人类基因组中的新型微卫星、过度代表性基序和功能元件。Natalie C. Fonville、Karthik Raja Velmurugan、Hongseok Tae、Zalman Vaksman、Lauren J. McIver 和 Harold R. Garner,《科学报告》6,文章编号:27722 (2016),doi:10.1038/srep27722
https://www.genome.gov/11006943/human-genome-project-completion-frequently-asked-questions/
https://en.wikipedia.org/wiki/Reference_genome
https://en.wikipedia.org/wiki/Telomere