生命的密码的意外来源

新兴数据表明看似不可能的事——神秘的新基因从“垃圾”DNA中产生

来自 夸塔杂志 (在此处查找原始故事)。

基因和人一样,也有家族——谱系可以追溯到很久以前的创始成员。那位祖先不断繁殖和扩散,每次迭代都略有变形。

在过去 40 年的大部分时间里,科学家们认为这是新基因诞生的主要方式——它们只是从现有基因的副本中产生的。旧版本继续执行其工作,新副本则可以自由进化出新功能。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关发现和塑造我们当今世界的想法的具有影响力的故事的未来。


然而,某些基因似乎违背了这种起源故事。它们没有已知的亲属,并且与任何其他基因都不相似。它们就像是在偏远雨林深处发现的神秘野兽的分子等价物,一种生物谜题,似乎与地球上的任何其他事物无关。

这些孤儿基因从何而来之谜困扰了科学家数十年。但在过去几年中,一种曾经离经叛道的解释迅速获得了势头——许多孤儿基因是从所谓的垃圾 DNA 或非编码 DNA(基因之间神秘的 DNA 片段)中产生的。“遗传功能以某种方式突然出现,”加州大学戴维斯分校的生物学家大卫·贝根说。

这种蜕变曾经被认为是不可能的,但是从酵母菌和果蝇到小鼠和人类等生物体中越来越多的例子已经使该领域的大多数人相信,这些从头基因确实存在。一些科学家说它们甚至可能很常见。就在上个月,在维也纳举行的分子生物学和进化学会上提出的研究报告确定了 600 个潜在的新人类基因。“从头基因的存在应该是一件罕见的事情,”巴塞罗那海洋医院研究所的进化生物学家玛尔·阿尔巴说,他介绍了这项研究。“但是人们已经开始越来越多地看到它。”

研究人员开始认识到从头基因似乎构成了基因组的重要组成部分,但科学家们几乎不知道有多少基因或它们的作用是什么。更重要的是,这些基因的突变会引发灾难性的失败。“看起来这些新基因往往是最重要的基因,”德国明斯特大学的生物信息学家埃里希·博恩伯格-鲍尔说。

新基因似乎在小鼠谱系(红线)的进化历史中的各个点爆发式出现。大约 8 亿年前的激增与地球从“雪球”阶段(当时地球几乎完全冰冻)中脱离出来的时间相对应。最近的峰值代表新生的基因,其中许多基因随后将丢失。如果所有基因都通过复制产生,那么它们都将在生命起源后不久(大约 38 亿年前)产生(绿线)。
奥莱纳·施马哈洛/夸塔杂志;来源:Tautz 和 Domazet-Lošo,《自然评论:遗传学》,2011 年。

孤儿基因追逐
标准的基因复制模型解释了数千个已知的基因家族,但它有局限性。它暗示大多数基因创新都发生在生命历史的早期。根据这个模型,35 亿年前的最早的生物分子会创造出一组遗传构建块。然后,生命的每次新迭代都将仅限于调整这些构建块。

然而,如果生命的工具箱如此有限,进化如何产生我们今天在地球上看到的庞大动物群?“如果新部件仅来自旧部件,我们将无法解释发育的根本变化,”博恩伯格-鲍尔说。

严格的复制模型可能不足以满足需求的第一个证据出现在 20 世纪 90 年代,当时 DNA 测序技术开始普及。研究人员分析酵母基因组后发现,该生物体三分之一的基因与其他生物体中已知的基因没有相似之处。当时,许多科学家认为这些孤儿基因属于尚未被发现的家族。但这种假设并未被证实。在过去的十年中,科学家们对来自数千种不同生物体的 DNA 进行了测序,但许多孤儿基因仍然无法分类。它们的起源仍然是个谜。

2006 年,贝根发现了一些最早的证据,证明基因确实可以从非编码 DNA 中突然出现。他将标准实验室果蝇黑腹果蝇的基因序列与其他密切相关的果蝇物种进行了比较。不同的果蝇共享其基因组的绝大部分。但是贝根和合作者发现了几种基因,这些基因仅存在于一两个物种中,而其他物种中则不存在,这表明这些基因不是现有祖先的后代。贝根转而提出,果蝇基因组中随机序列的垃圾 DNA 可能会突变成功能基因。

然而,从随机 DNA 序列创建基因似乎与将一罐拼字游戏瓷砖倒在地板上并期望这些字母拼出连贯的句子一样不可能。垃圾 DNA 必须积累突变,使其能够被细胞读取或转化为 RNA,以及指示基因应在何时何地活跃的调控组件。就像句子一样,基因必须有开头和结尾——指示其开始和结束的短代码。

此外,基因产生的 RNA 或蛋白质必须有用。新生的基因可能会被证明是有毒的,产生有害的蛋白质,例如那些在阿尔茨海默病患者大脑中聚集在一起的蛋白质。“蛋白质有很强的错误折叠和造成严重破坏的趋势,”亚利桑那大学图森分校的生物学家乔安娜·马塞尔说。“很难想象如何从随机序列中获得一种新的蛋白质,因为你期望随机序列会造成如此多的麻烦。”马塞尔正在研究进化可能绕过这个问题的方法。

贝根假设的另一个挑战是,很难区分真正的从头基因与从其祖先发生巨大变化的基因。(鉴定真正的从头基因的难度仍然是该领域争论的焦点。)

十年前,马克斯·普朗克进化生物学研究所的生物学家迪特哈德·陶茨是许多对贝根的想法持怀疑态度的研究人员之一。陶茨为孤儿基因找到了其他解释。一些神秘基因进化得非常快,使其祖先无法识别。其他基因是通过重组现有基因的片段而产生的。

然后他的团队偶然发现了Pldi基因,他们以德国足球运动员卢卡斯·波多尔斯基的名字命名了该基因。该序列存在于小鼠、大鼠和人类中。在后两个物种中,它保持沉默,这意味着它不会转化为 RNA 或蛋白质。DNA 仅在小鼠中活跃或转录为 RNA,在小鼠中,它似乎很重要——没有它的雄鼠精子速度较慢,睾丸较小。

研究人员能够追溯将沉默的非编码 DNA 片段转化为活性基因的一系列突变。这项工作表明,新基因是真正的从头基因,并排除了另一种可能性——它属于现有的基因家族,只是进化到无法识别的程度。“那时我才想,好吧,这一定是可能的,”陶茨说。

新基因浪潮
科学家们现在已经编目了许多明确的从头基因的例子:一种酵母基因,它决定它是进行有性繁殖还是无性繁殖;一种果蝇和其他双翅目昆虫的基因,它对于飞行变得至关重要;以及一些仅在人类中发现的基因,其功能仍然令人着迷地不清楚。

在上个月的分子生物学和进化学会会议上,阿尔巴和合作者使用强大的 RNA 分析新技术,在人类和黑猩猩中鉴定出数百个推定的从头基因——比之前的研究多十倍。在阿尔巴团队发现的 600 个人类特有基因中,有 80% 是全新的,以前从未被鉴定过。

不幸的是,破译从头基因的功能远比鉴定它们困难得多。但至少其中一些基因并没有做基因等价于无所事事的事情。有证据表明,一部分从头基因很快变得至关重要。果蝇中约 20% 的新基因似乎是生存所必需的。许多其他基因也显示出自然选择的迹象,这证明它们正在为生物体做一些有用的事情。

在人类中,至少有一个从头基因在大脑中活跃,这导致一些科学家推测,此类基因可能有助于推动大脑的进化。其他基因在突变时与癌症有关,这表明它们在细胞中具有重要功能。“失调会产生如此毁灭性的后果这一事实意味着正常功能是重要或强大的,”都柏林三一学院的遗传学家奥伊夫·麦克莱萨特说,他鉴定了第一个人类从头基因

混乱的蛋白质 从头基因也是更大转变的一部分,是我们对蛋白质外观及其工作方式的概念的改变。从头基因通常很短,并且产生小蛋白质。从头蛋白质不是折叠成精确的结构(蛋白质行为方式的传统概念),而是具有更无序的结构。这使得它们有点松软,使蛋白质能够与更广泛的分子结合。在生物化学术语中,这些年轻的蛋白质是混乱的。

科学家们对这些较短的蛋白质的行为方式知之甚少,这主要是因为标准筛选技术往往会忽略它们。大多数用于检测基因及其相应蛋白质的方法都会挑选出与现有基因具有一定相似性的长序列。“很容易错过这些,”贝根说。

这种情况正在开始改变。随着科学家们认识到较短蛋白质的重要性,他们正在实施新的基因发现技术。因此,从头基因的数量可能会激增。“我们不知道较短的基因会做什么,”马塞尔说。“关于它们在生物学中的作用,我们还有很多东西要学习。”

科学家们还想了解从头基因如何被纳入驱动细胞的复杂反应网络,这是一个特别令人费解的问题。这就像一辆自行车自发地长出一个新零件,并迅速将其纳入其机械装置中,即使没有它,自行车也能正常工作。“问题令人着迷,但完全未知,”贝根说。 

一种名为 ESRG 的人类特有基因特别好地说明了这个谜团。在猴子和其他灵长类动物中发现了一些序列。但它仅在人类中活跃,在人类中,它对于维持最早的胚胎干细胞至关重要。然而,猴子和黑猩猩在没有它的情况下也能很好地制造胚胎干细胞。“这是一种人类特有基因,它执行的功能必定早于该基因,因为其他生物体也具有这些干细胞,”麦克莱萨特说。

“新基因如何变得有功能?它如何被纳入实际的细胞过程?”麦克莱萨特说。“对我来说,这是目前最重要的一个问题。”

经 夸塔杂志许可转载,夸塔杂志是 西蒙斯基金会的编辑独立出版物,其使命是通过报道数学以及物理和生命科学领域的研究进展和趋势,增进公众对科学的理解。

© . All rights reserved.