大约在 800 万到 1200 万年前,包括人类在内的类人猿的祖先经历了剧烈的基因变化。小段 DNA 像草坪上的蒲公英一样复制并散布在它们所在的染色体上。但是,当这些“蒲公英种子”散布开来时,它们会携带一些草和雏菊种子——额外的 DNA 片段——一同前进。这种不寻常的模式,在基因组的不同部分重复出现,仅在类人猿(倭黑猩猩、黑猩猩、大猩猩和人类)中发现。
“我认为这是人类进化中缺失的一块拼图,”西雅图华盛顿大学的遗传学家埃文·艾希勒说。“我的感觉是,这些重复片段是新基因诞生的基质。”
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。
在过去的几年里,科学家们已经开始揭示这些区域中少数基因的功能;它们似乎在大脑中起着重要的作用,与新细胞的生长以及大脑的大小和发育有关。9 月,艾希勒的团队发表了一种新技术,用于分析这些基因在人与人之间的差异,这可能会进一步揭示它们的功能。
关于复制过程及其影响的许多内容仍然是个谜。艾希勒和其他人不知道是什么刺激了最初的复制回合,或者这些被称为“核心复制子”的区域是如何复制并在基因组中移动的。
尽管与复制相关的基因在人类进化中具有潜在的重要性,但大多数基因尚未得到广泛分析。重复区域的重复结构使得使用标准的遗传方法研究它们特别困难——最有效的 DNA 测序方法首先将基因组切成碎片,读取小块的序列,然后像拼图一样组装这些片段。尝试组装重复部分就像尝试拼凑一个由几乎相同图案的碎片组成的拼图。
“由于这些区域非常复杂,它们经常被常规的基因组研究忽略,一些区域仍然没有完全测序,”科罗拉多大学医学院奥罗拉分校的遗传学家詹姆斯·西凯拉说。“因此,它们不仅重要,而且不幸的是,它们没有得到研究。”
基因爆发
2007 年,艾希勒和他的合作者承担了一项看似艰巨的任务——全面研究人类基因组的重复片段。之前的研究已经描述了个别区域,但艾希勒的团队采用了新的计算技术和比较基因组学——比较来自不同物种的 DNA 序列——来检查整个基因组。当年发表在《自然遗传学》上的数学分析揭示了一组“核心复制子”——在特定染色体上反复出现的 DNA 片段。
核心复制子是一个结构复杂的 DNA 片段的锚点,作为较大复制块的焦点。尽管科学家们不确定是如何发生的,但核心似乎会扫过相邻的 DNA 片段,复制整个片段并将新副本插入到染色体的新位置。“然后它再次拾起并复制其周围的一些序列,并移动到另一个新位置,”艾希勒说。“它似乎是一个极不稳定的遗传元素,为进化变化提供了模板。”
正是这个过程似乎创造了新的基因:当新的复制插入基因组时,它们将两个以前陌生的 DNA 片段结合在一起,这可能会导致新的功能成分,例如蛋白质。这种混乱的混合搭配方法不同于传统的基因创造模型,在该模型中,现有基因被复制,副本可以自由地开发新功能。
休斯顿贝勒医学院的遗传学家菲利普·黑斯廷斯说:“这种机制在我们进化过程中似乎具有开创性意义。”“我们之所以成为现在的样子,很可能是因为这种产生染色体结构剧烈变化的机制。”
复制子产生的模式似乎是类人猿独有的,这表明该机制本身也是这些物种独有的。在其他动物中,重复区域彼此相邻排列,而不是沿染色体分散排列。
类人猿中的重复区域往往非常活跃,这意味着它们的基因比其他区域的基因更频繁地开启,并且它们产生更多的 RNA 和蛋白质。这表明这些区域在功能上很重要。
艾希勒和其他人到目前为止仅描述了大约十几个复制子区域中的一半的结构,每个区域对其所在的染色体都是独一无二的。迄今为止的大多数分析都集中在该区域的进化历史,包括基因来自哪里、它们的进化速度以及它们彼此之间的关系。艾希勒说,他的团队在理解它们的功能方面遇到了更大的困难,尽管他和其他人已经设法研究了少数与复制相关的基因的功能。
科学家们所知道的是,这些基因在进化中似乎很重要。根据艾希勒的说法,与核心复制子相关的基因家族中大约三分之一显示出正选择的迹象——这意味着它们可以提高携带者的生存能力并传递给下一代,从而促进进化——而总体基因的比例约为 5%。事实上,在十多年前首次描述的其中一个核心上的一个基因似乎是进化最快的人类基因。然而,艾希勒警告说,在这些人类或猿特异性基因中衡量正选择是很棘手的,因为科学家们几乎没有可与之比较的基因。为了衡量选择,科学家通常会比较不同物种中的基因,以检查它的变化程度。
就像树干的年轮一样,核心复制子的外部区域是最新的,来自最新一轮的复制。这些区域也往往因人而异。因此,它们可能会导致疾病——重要基因或 DNA 片段的额外或删除的副本可能会影响细胞或器官的功能。艾希勒的团队的目标是使用他们在 9 月份的《自然方法》论文中描述的新方法来跟踪重复区域的变异,这可以深入了解这些基因的功能。研究人员将寻找这些区域内 30 个人类特异性基因在患有智力障碍和癫痫等发育障碍的儿童中的变异。如果某个基因或区域的变化与特定特征(如大脑大小的变化)可靠地相关联,则可以提示该基因的功能。
艾希勒说,迄今为止研究的与复制相关的基因“似乎对细胞增殖很重要,无论是加速还是减慢它。”“它们在许多组织中表达,但在大脑中高度表达,通常在神经元中,并且通常在细胞快速分裂的区域中表达。” 事实上,当某些基因过度活跃时,它们会与癌症相关联。
更大的大脑
大约在 340 万年前,人类后代中现在被称为 1 号染色体上的一个核心复制子进行了其特征性的跳跃之一,并带走了一个名为 SRGAP2 的基因的副本。大约一百万年后,它再次跳跃,创造了原始基因的孙女。迄今为止,在基因组中检查过的其他哺乳动物都没有该基因的多个副本,并且这种跳跃与人类进化的关键点相吻合:当南方古猿进化为能人时,200 万至 300 万年前,人类的大脑正在逐渐扩大一倍。
被称为 SRGAP2C 的孙女基因对于人类大脑可能尤为重要。2012 年,艾希勒的团队和圣地亚哥附近的斯克里普斯研究所的一个小组表明,SRGAP2C 可以影响神经元在发育中的大脑中的迁移方式。通过在小鼠中表达该基因的人类版本,斯克里普斯团队表明,SRGAP2C 可以减缓某些脑细胞的成熟,并触发更密集的神经元结构(称为棘)的发展,从而有助于在大脑细胞之间形成连接。“我并不是说它导致了人类大脑的扩张,但它可能在使神经前体[产生神经元的细胞]到达正确的位置方面发挥作用,”艾希勒说。
SRGAP2 的发现表明,人类特异性的基因变化如何导致神经元的变化。“这正是该领域所缺失的,”达拉斯德克萨斯大学西南医学中心的神经科学家吉纳维芙·科诺普卡说。“人们已经确定了人类谱系中的独特变化,但他们还没有以任何功能性方式对它们进行跟进。”
科诺普卡说,诸如 SRGAP2 论文之类的研究,深入研究基因的功能,可以帮助阐明人类特异性基因变化在我们物种发展中所起的作用。“任何时候你能够证明人类基因组中的某些东西是独特的,以及它如何改变生物学,这都是一件独特而重要的事情,”她说。
双刃剑 DNA
核心复制子代表着某种进化赌博。使新基因得以产生的相同的遗传不稳定性也可能会破坏或删除现有基因或产生过多副本,这也许可以解释我们对疾病的某些易感性。重复片段的部分已与多种脑部疾病相关联,包括智力障碍、精神分裂症和癫痫。
当研究人员搜索在人类中比其他类人猿更频繁地复制的遗传区域时,一段名为 DUF1220 的短 DNA 片段引起了他们的注意。DUF1220 在人类中的复制速度比基因组的任何其他蛋白质编码区域都快,并且与大脑大小有关,这表明它促进了人类大脑的进化,也与疾病有关,这表明该基因片段太少或太多都可能有害。
DUF1220 本身不是一个基因,而是在一个基因家族中发现的遗传成分——该家族中的每个基因携带 5 到 50 个拷贝。总体而言,人类拥有超过 250 个 DUF1220 拷贝,其他大型猿类拥有 90 到 125 个,猴子大约 30 个,而非灵长类动物则少于 10 个。2012 年,Sikela 及其合作者使用特殊工具计算了健康人群中的拷贝数量,发现某人拥有的拷贝越多,其灰质(由神经细胞组成的大脑部分)就越大。
尽管 DUF 重复序列似乎在脑容量方面提供了进化优势,但也可能产生有害影响。DUF 重复序列集中在 1 号染色体上一个不稳定的区域,称为 1q21。该区域的缺失或重复与多种疾病有关,包括自闭症、精神分裂症、心脏病以及小头畸形或巨头畸形,即某人的大脑分别异常地小或大。Sikela 的团队发现,在 1q21 区域的所有序列中,DUF1220 重复序列的数量与患有小头畸形的人的脑容量联系最为紧密。“人类谱系中拷贝数量的大幅增加付出了惨重的代价,”Sikela 说。
根据 Sikela 的说法,额外的拷贝使得该区域不稳定,使得该区域的基因更有可能被进一步删除或重复。“这是我们为 DUF 的好处必须付出的代价,这是进化赋予我们的权衡,”他说。
未知的领域
虽然核心重复序列是人类进化背后驱动力的证据正在增长,但仍有许多问题悬而未决。例如,尚不清楚是什么触发了这些核心的产生或它们是如何传播的。一种流行的理论指向一类被称为逆转录病毒的病毒,它们可以将 DNA 插入到宿主的基因组中,然后代代相传。也许逆转录病毒是最初核心重复序列的罪魁祸首。已知我们基因组的很大一部分来自已经留下 DNA 印记但不再在细胞中活跃的病毒。“我最喜欢的假设是,在大型猿类进化的关键时刻,逆转录病毒活动爆发了,”英国莱斯特大学的遗传学家爱德华·霍洛克斯 (Edward Hollox) 说。
有趣的是,曾经在我们基因组中如此活跃的核心重复序列似乎已经放慢或停止了跳跃。尽管有证据表明大型猿类的进化史中出现了几次爆发,但科学家们尚未发现过去几百万年中发生的重复。Eichler 的团队一直在寻找此类案例,发现了一些较新的重复,科学家们认为这些重复是人类特有的,并且与尼安德特人不同。“但它们是例外,而不是规则,”他说。
目前尚不清楚核心重复序列在我们物种的形成中发挥了多大的作用。“很难提供一个关于大型猿类进化的总体理论,”霍洛克斯说。“毫无疑问,核心重复序列假说是其中的一部分。它贡献了多少,目前仍在讨论中。”
研究表明,其他因素(如基因调控——特定基因何时何地被激活)也发挥着作用。但是,基因调控的变化可能不足以解释灵长类动物和人类之间的所有差异。“我知道大脑进化会有多种途径,”科诺普卡说,并补充说核心重复序列“可能是主要的参与者之一”。
经Quanta Magazine许可转载,它是SimonsFoundation.org的一个编辑独立的部门,其使命是通过报道数学以及物理和生命科学的研究进展和趋势来提高公众对科学的理解。