乍一看,这份动物名单可能让人联想到任何动物园。这里有大象、犰狳、负鼠、海豚、树懒、刺猬、大小蝙蝠、几只鼩鼱、一些鱼、猕猴、猩猩、黑猩猩和大猩猩——仅举几个比较熟悉的生物。但这个动物集合与之前构建的任何动物园都截然不同。这里没有笼子,没有特许摊位,实际上也没有动物。这是一个“虚拟”动物园,仅包含这些动物的 DNA 序列——构成每个物种的遗传配方的数亿到数十亿个 DNA 代码字母。
最兴奋的这个新分子动物园的参观者是进化生物学家,因为其中蕴藏着进化的大量详细记录。几十年来,科学家们一直渴望了解物种的巨大多样性是如何产生的。半个世纪以来,我们都知道,从体色到大脑大小,身体特征的变化源于 DNA 的变化。然而,直到最近,确定广阔的 DNA 序列中哪些变化导致动物具有独特的外观仍然遥不可及。
生物学家现在正在破译 DNA 记录,以找到使不同种类的苍蝇、鱼类或雀类彼此看起来不同,以及使我们人类与黑猩猩不同的指令。这项探索导致了我们观点的深刻改变。在过去 40 年左右的大部分时间里,研究人员将大部分注意力集中在基因上——DNA 中编码形成蛋白质的氨基酸链的核苷酸序列。但令我们惊讶的是,事实证明,外观上的差异具有欺骗性:非常不同的动物具有非常相似的基因组。通过追寻进化的轨迹,人们在 DNA 中发现了装置——基因“开关”——它们不编码任何蛋白质,但调节基因在何时和何地被使用。这些开关的变化对于解剖结构的进化至关重要,并为动物王国看似无穷无尽的形态是如何进化的提供了新的见解。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和思想的有影响力的故事的未来。
解剖基因和编码悖论 长期以来,科学家们当然期望动物之间的解剖学差异会反映在其基因组内容的明显差异中。然而,当我们比较哺乳动物基因组(如小鼠、大鼠、狗、人类和黑猩猩的基因组)时,我们发现它们各自的基因目录非常相似。每种动物基因组中基因的大概数量(大约 20,000 个左右)和许多基因的相对位置在超过 1 亿年的进化过程中都得到了很好的维护。这并不是说基因数量和位置没有差异。但乍一看,这些基因清单中没有任何东西在喊“小鼠”或“狗”或“人类”。例如,在比较小鼠和人类基因组时,生物学家能够为我们至少 99% 的基因识别出小鼠对应物。
换句话说,我们人类并没有像某些人曾经认为的那样,比我们的宠物、害虫、家畜甚至河豚拥有更多的基因。也许令人失望,但我们必须克服它。
当生物学家详细观察单个基因时,物种之间的相似性也是普遍规律。任何两个基因版本的 DNA 序列,以及它们编码的蛋白质,通常都非常相似,其程度仅仅反映了自这两个物种从共同祖先分化以来经过的相对时间量。当人们考虑到参与身体构建和身体模式形成的基因时,编码序列在进化时间上的这种保存尤其令人费解。
在所有基因中,只有一小部分——不到 10%——致力于在动物从受精卵到成虫的发育过程中构建和模式化动物身体。其余的则参与各种器官和组织内细胞的日常任务。动物之间的解剖学差异——身体部位的数量、大小、形状或颜色的差异——必然在某种程度上与身体构建基因有关。事实上,对与解剖结构发育相关的基因和过程在进化中发挥的关键作用的研究甚至赢得了自己的绰号:evo-devo(进化发育生物学)。对于我们这些该领域的研究专家来说,发现身体构建蛋白质平均而言甚至比其他蛋白质更相似尤其令人感兴趣,因为它似乎提出了一个悖论:像小鼠和大象这样不同的动物是由一组非常相似、功能上无法区分的身体构建蛋白质塑造的。同样的道理也适用于人类和我们最亲近的现存亲属——我们的大多数蛋白质与黑猩猩的蛋白质相比,仅在一个或两个由数百个氨基酸组成的氨基酸上存在差异,而且我们 29% 的蛋白质在序列上完全相同。我们如何解释蛋白质和解剖结构这两个水平的进化之间的这种差异?在所有这些基因组 DNA 中,必然存在有意义的进化差异。诀窍是找到它们,而找到它们的诀窍是决定在哪里寻找。事实证明,这些位置比基因本身更难找到。
基因开关 在人类中,DNA 的蛋白质编码片段仅占我们基因组的约 1.5%,因此基因实际上就像 DNA 序列浩瀚海洋中的小信息岛屿。剩余的非编码 DNA 大部分我们不知道有什么作用,但其中一些序列参与了非常重要的基因表达调控任务。而这些调控序列是进化的关键。
基因的表达需要将 DNA 序列转录成信使 RNA (mRNA) 版本,并将 mRNA 翻译成蛋白质序列。大多数基因的表达在转录水平上受到调控——细胞不会浪费能量来制造它们不需要的 mRNA 和蛋白质。因此,许多基因仅以器官、组织或细胞类型特异性的方式表达。某些非编码 DNA 序列在指导何时何地发生这种情况方面起着至关重要的作用。它们是“基因开关”的组成部分,这些开关在身体的正确时间和地点开启或关闭基因。序列特异性 DNA 结合蛋白(称为转录因子,它是开关的其他组成部分)识别这些 DNA 序列,通常称为增强子。转录因子与细胞核内增强子的结合决定了该细胞中的开关和基因是开启还是关闭。
每个基因至少有一个增强子。与基因本身不同,基因本身的编码区域由于遗传密码相当简单的语法而很容易识别,增强子不能仅根据其 DNA 序列来识别,必须通过实验来识别。增强子通常有数百个碱基对的长度,可能位于基因的任一侧,甚至位于基因内部的非编码片段中。它们也可能距离基因本身数千个核苷酸。
对于我们在此处的讨论最重要的是,一些基因有许多独立的增强子。对于编码塑造解剖结构的蛋白质的基因尤其如此。每个增强子独立地调节基因在身体不同部位和动物生命周期不同时期的表达,因此基因的完整表达是多个独立控制的表达位点的拼凑而成。这些增强子使同一个基因可以在不同的背景下多次使用,从而极大地扩展了单个基因的功能通用性。
果蝇身体部位着色基因说明了这个基因调控系统的模块化逻辑。这个名字有些令人困惑的 Yellow 基因编码一种促进黑色素形成的蛋白质(没有这种蛋白质的突变苍蝇是 Yellow)。Yellow 基因具有独立的增强子,可以在各种果蝇身体部位(包括翅膀和腹部)的发育过程中激活它。
由于 Yellow 基因在许多组织的发育过程中发挥作用,因此基因本身的突变如果改变或禁用蛋白质的功能,可能会是灾难性的;它们会影响整个生物体中 Yellow 色素蛋白的功能。相比之下,仅基因的一个增强子的变化只会影响该增强子的功能,并且只会影响由该增强子控制的 Yellow 基因表达,而蛋白质在其他组织中的表达和功能保持不变。
身体模式形成基因模块化调控的进化意义是深远的。从理论上讲,增强子中的突变将允许选择性地修饰个体身体特征,而无需改变基因或蛋白质本身。在过去几年中,直接证据表明,这通常是各种身体部位和模式进化发生的方式。
进化的开关 生物学中最重要的策略之一是识别人们希望理解的现象的最简单实验模型。关于身体模式的进化,颜色最符合要求。它是动物最明显的特征之一,并在动物与其环境和彼此之间的相互作用中发挥着重要作用。果蝇的体色模式在密切相关的物种中迅速多样化,对果蝇如何获得斑点和条纹的分析说明了基因开关的进化如何以及为何塑造了解剖结构的进化。
在某些物种中,雄性翅膀边缘有强烈的黑点,而其他物种则没有这些斑点。在某些相同的物种中,雄性腹部非常黑(这也是最著名的果蝇 Drosophila melanogaster 得名的原因:melanogaster 意思是“黑腹”),而其他物种的雄性则没有这条黑带。在翅膀有斑点的物种中,雄性在跳舞求偶时会向雌性展示它的斑点。我们发现,在有斑点的物种中,Yellow 蛋白质在将形成斑点的细胞中产生量非常高,而在翅膀细胞的其他部分产生量很低。在没有斑点的物种中,Yellow 仅在整个翅膀中以低水平产生,仅产生一层淡淡的黑色素。
为了弄清楚 Yellow 如何在某些物种的翅膀斑点中产生而在其他物种中不产生,我们在 Yellow 基因周围的 DNA 序列中搜索了控制其在身体各个部位表达的增强子。在没有斑点的物种中,有一个增强子驱动 Yellow 在翅膀中以低均匀模式表达。这种翅膀增强子活性产生了果蝇翅膀的浅灰色。当分析来自有斑点物种的相应 DNA 片段时,我们发现它既驱动这种低水平模式,又驱动基因表达的强烈斑点模式。在有斑点物种的进化过程中发生的是,在翅膀中产生的转录因子的新结合位点在 Yellow 翅膀增强子 DNA 序列中进化出来。这些变化创造了一种表达模式——翅膀斑点——而没有改变 Yellow 蛋白质在身体其他部位的产生位置或功能 [见方框]。
一个类似的故事适用于腹部黑带的进化,但有一个转折。虽然我们自然而然地认为,一个特征在一个物种中存在而在另一个相关物种中不存在是前者获得的结果,但情况往往并非如此。进化的另一面,特征的丧失,非常普遍,尽管远未受到重视。身体特征的丧失也许最好地说明了为什么增强子的进化是解剖结构进化的更可能途径。
Yellow 基因的一个增强子控制其在腹部的表达。在具有黑带的物种的雄性中,这个增强子驱动 Yellow 基因在腹部后部的细胞中以高水平表达。但是一些物种,例如 Drosophila kikkawai,在进化过程中失去了这条色素带。在 D. kikkawai 中,增强子不再能够驱动 Yellow 在腹部后部的高水平表达,因为一些突变破坏了它的一些转录因子结合位点。
重要的是要强调,Yellow 基因在身体的其他部位仍然活跃,并且它的生化功能完好无损。虽然失去黑带的一种途径可能是通过使 Yellow 基因及其蛋白质失活的突变,但自然选择不允许这条途径,因为 Yellow 功能在身体其他部位的丧失会产生额外的、不利的后果。
特征的丧失可能对生存或更大的生殖成功有利也可能不利,但有些丧失是适应性的,因为它们促进了生活方式的某些改变。例如,后肢在脊椎动物中已经多次丧失——蛇、蜥蜴、鲸鱼和海牛——这些丧失与适应不同的栖息地和运动方式有关。四足脊椎动物后肢的进化先驱是鱼类的腹鳍。腹鳍解剖结构的巨大差异也在密切相关的鱼类种群中进化出来。三刺鱼在北美许多湖泊中以两种形式存在——一种具有完整多刺骨盆的开阔水域形式,以及一种骨盆明显缩小和棘刺萎缩的浅水、底栖形式。在开阔水域中,长长的棘刺有助于保护鱼类免受较大捕食者的吞噬。但在湖底,这些棘刺是一种累赘,因为以幼鱼为食的蜻蜓幼虫可以抓住它们。
这些鱼类之间骨盆形态的差异在自上次冰河时代以来短短 10,000 年的时间里反复进化出来。长棘刺的海洋刺鱼殖民了许多独立的湖泊,而缩小的形式则独立进化了多次。由于这些鱼类亲缘关系非常近,并且在实验室中可以杂交,因此遗传学家可以绘制出与刺鱼骨盆缩小有关的基因。斯坦福大学的 David M. Kingsley 与不列颠哥伦比亚大学的 Dolph Schluter 及其同事一起表明,与骨盆骨骼构建相关的基因表达的变化与骨盆缩小有关。与大多数其他身体构建基因一样,Pitx1 基因在鱼类的发育中具有多项任务。但它的表达在将产生骨盆鳍芽和棘刺的鱼类区域中被选择性地丧失。再一次,增强子的进化变化是罪魁祸首。不同形式的刺鱼之间的 Pitx1 蛋白质没有编码变化。
Yellow、Pitx1 和大多数其他身体构建和身体模式形成基因被认为是多效性的,因为它们影响多种性状的形成或外观。多效性基因编码序列的突变对该基因控制的所有性状都有多种影响,而这种剧烈的变化不太可能被自然选择所容忍。从斑点、条纹和骨骼的进化中得出的关键教训是,调控序列中的突变规避了编码序列突变的多效性效应,并允许选择性地修饰个体身体部位。调控序列中的突变并非唯一的进化模式——当基因具有多种作用,并且其中一种作用被选择性地修饰时,它们只是更可能的途径。
共同的基因,无穷的变化 增强子的进化根本不局限于影响身体形态的基因,也不仅仅局限于果蝇和奇怪的鱼类。对于人类特征而言,也已经证明了许多调控序列进化变化改变基因表达的例子。
在最近的人类进化中,一个更引人注目的案例代表了通过选择性丧失基因表达来适应疟疾流行的环境。除了熟悉的 A、B 和 O 血型外,其他所谓的次要血型也得到了充分研究。红细胞表面上存在的一种名为 Duffy 的蛋白质的状态定义了这些类型中的一种。Duffy 蛋白质构成了导致疟疾的寄生虫 Plasmodium vivax 用来感染红细胞的受体的一部分,但在西非,几乎 100% 的人口的血细胞中都缺乏这种蛋白质,这使得个体能够抵抗感染。Duffy 基因也在其他几种身体组织中表达,包括脾脏、肾脏和大脑的细胞。在非洲人群中,Duffy 在这些其他组织中的表达得到了保留。毫不奇怪,这些 Duffy 阴性个体携带 Duffy 基因增强子中的突变,该突变敲除了激活红细胞前体中 Duffy 表达的转录因子的结合位点,但对其他部位的 Duffy 产生没有影响。
杜克大学的 Gregory A. Wray 和他的合作者已经确定了人类生物学的其他方面,这些方面是通过不同人类基因增强子中的突变进化而来的。迄今为止揭示的最有趣的关联之一涉及控制 Prodynorphin 基因的大猿和人类调控序列的差异,该基因编码一组在大脑中产生并参与感知、行为和记忆的小型阿片类蛋白质。人类基因比黑猩猩版本对刺激的反应表达更高,并且强有力的证据表明,人类调控序列在自然选择下进化而来——也就是说,它被保留是因为它是有利的。
正如这些例子所示,调控 DNA 中的突变无疑在人类进化中发挥了作用,调控变异也可能是个体之间身体和健康差异的重要来源。由于科学家无法像对果蝇和鱼类那样对活人的 DNA 进行修补,因此研究某些导致我们与其他物种分化的调控 DNA 变化的例子有些困难,尽管一些分析基因组的新方法正在产生令人鼓舞的线索 [见方框]。
对基因调控 DNA 序列进化的研究仍处于早期阶段。虚拟基因组动物园中的数十万个基因开关尚未被发现或研究。然而,生物学家已经开始学习新的原理,这些原理对未来的研究具有预测价值:解剖结构的进化变化,特别是涉及多效性基因的进化变化,更有可能通过基因增强子的变化而不是基因本身的变化发生。
这种现象也揭示了非常不同的动物群体如何共享大部分(如果不是全部)参与身体构建和身体模式形成的基因——这与科学家早期的预期相反,这主要是关于如何以及何时使用这些基因来塑造动物王国的不同形态。如果我们真的想了解是什么使人类形态不同于其他猿类,或者是什么使大象不同于小鼠,那么,大部分信息不在于我们各自的基因和蛋白质,而在于我们基因组中一个完全不同的领域,这个领域仍有待探索。
编者注:本文最初的标题为“调控进化”