“垃圾”DNA 蕴藏着常见疾病的线索

随着人类基因组的新注释,研究人员发现,基因之间的大部分代码正在控制着生命和健康的关键功能

人类基因组草图于2000年发布时,研究人员认为他们已经获得了人体秘密的解码环。他们拥有30亿个碱基对(A、T、C和G)的代码以及21,000个蛋白质编码基因,希望能够找到生命(包括疾病和健康)的遗传支架

但自那以来的12年里,很少有疾病(几乎都是非常罕见的疾病)被明确地与基因本身的变化联系起来。而且,寻找更常见疾病(如肺或自闭症)遗传基础的大型全基因组研究,都指向了蛋白质产生基因之间的基因组的深处——这些区域通常被认为包含“垃圾”DNA,而不是已知基因的一部分。

一个由数百名科学家组成的国际联盟现在已经破译了这种垃圾DNA的奇怪语言的大部分,并发现它根本不是垃圾。相反,它包含着调节我们基因的重要信号,决定着疾病风险、身高以及许多其他复杂的方面,这些方面使我们每个人都与众不同。这些发现发表在9月5日在线发表于《自然》杂志和其他期刊上的30篇相关论文中,并在该联盟的网站上进行了描述。(《大众科学》是自然出版集团的一部分。)

该小组名为DNA元素百科全书(ENCODE),其重点不仅在于理解基因组的元素,还在于理解它们如何协同工作。“我们生物学的复杂性不在于我们基因的数量,而在于调节开关,”美国国立人类基因组研究所所长兼ENCODE项目合作者埃里克·格林在9月5日的新闻发布会上表示。通过1600多个独立的实验,对140多种细胞类型进行分析,以及大量的数据分析,该小组发现了大约400万个所谓的开关,现在可以为整个基因组的80%以上分配功能。相比之下,基因组中负责研究人员一直依赖的蛋白质编码基因来寻找疾病和特征的基因组只占大约2%。 “基因组计划是关于建立构成蓝图的字母集,”格林说,“当我们最终将蓝图拼凑起来时,我们意识到我们实际上只能理解其中的一小部分。”


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关当今塑造我们世界的发现和想法的有影响力的故事的未来。


这些新编目的开关不仅激活和停用基因,还控制着每个蛋白质的产生量以及产生时间。它们参与表观遗传变化,例如DNA甲基化,它与心血管疾病和其他疾病有关。新数据有望提高我们对许多可能具有相似遗传基础的常见疾病的理解。华盛顿大学医学院基因组科学副教授兼ENCODE合作者约翰·斯塔马托亚诺普洛斯在简报中说,全基因组关联研究(GWAS)在识别常见疾病的特定基因方面不断失败。“令人沮丧的是,这些研究中约有95%的信息都指向了不产生蛋白质的基因组区域,”他说。但是,现在有了ENCODE数据,他们可以开始破译这些疾病内部和之间可能常见的遗传开关和功能。“我们现在正在探索疾病之间以前隐藏的联系,这可能解释相似的临床[症状],”他指出。

这些新发现是免费提供的,但要将其应用于批准的疗法可能还需要一段时间。“制药行业在很大程度上放弃了基因组,”斯塔马托亚诺普洛斯说,“我认为这将极大地重振基因组的效用。”然而,这些额外的遗传元素已经在用于筛查和检测疾病(如乳腺癌、前列腺癌和自身免疫性疾病)方面发挥作用,阿拉巴马州哈德森阿尔法生物技术研究所所长理查德·迈尔斯在简报中指出。

该小组有资金继续他们的工作,并且预计未来的发现不会放缓。“我们的蓝图非常复杂,我们需要长期致力于理解它,”格林说。与12年前发布的人类基因组草图以及过去几年发布的ENCODE项目的初步发现相比,“我们现在可以提出的问题更加复杂了,”格林说。并且,希望这些更好的问题将带来更令人满意和在医学上有用的答案

© . All rights reserved.