在德克萨斯州一家图书馆的书架上,放着一本绿色小书,最初出版于150年前,现在被公认为有史以来最重要的科学著作之一。然而,当《物种起源》第一版印刷时,它的未来成功完全不明显。当查尔斯·达尔文完成他的新著作的校样时,他列出了一份应该收到样书的重要同事的简短名单。然后,他焦急地等待着他那个时代主要思想家的评判。
1859年,英国最著名的在世科学家在他保存在德克萨斯大学奥斯汀分校的绿色小书的笔记中潦草地写下了他的反应。在扉页上标有“作者赠送”字样,这是达尔文寄给约翰·赫歇尔爵士的样书,约翰·赫歇尔是达尔文的科学英雄之一,他自己的自然哲学专著首先启发达尔文成为一名科学家。19世纪30年代,赫歇尔令人难忘地将物种起源描述为“神秘中的神秘”,这可能是通过自然过程发生的。达尔文在该书的第一段引用了赫歇尔的话,这段话阐述了达尔文为赫歇尔和世界提供的“神秘中的神秘”的巧妙解决方案。
达尔文的理论既广泛又简单。他提出地球上所有生物都起源于一种或几种原始形式。他不敢妄称知道生命本身最初是如何产生的。然而,达尔文认为,一旦生命开始,生物体就会通过一个完全自然的过程开始缓慢地改变和多样化:所有生物都各不相同;差异是遗传的。那些具有在他们居住的环境中有利的性状变异的个体将比具有不利变异的个体更繁荣并产生更多的后代。因此,有利的性状将通过不可避免的“自然选择”过程随着时间的推移而积累。为了让读者相信自发变异和差异繁殖的累积力量,达尔文指出了在人类仅几个世纪的选择性育种后,家养植物、鸽子和狗的大小和形态发生的巨大变化。
支持科学新闻事业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻事业 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和思想的有影响力的故事的未来。
他的一些科学同事立刻看到了达尔文论点的力量。“我真笨,竟然没有想到这一点!”托马斯·亨利·赫胥黎在阅读完他自己的达尔文著作样书后惊呼道。不幸的是,达尔文说他“比几乎任何其他人”更重视其意见的人的反应远不那么积极。赫歇尔不相信有用的新性状和物种可以从简单的随机变异中产生,他认为这种想法是“随意堆砌定律”。在他的《物种起源》个人副本中,赫歇尔专注于“如果想要‘实现’任何事情,‘有利的变异’必须‘发生’”。达尔文实际上对变异性状本身的起源一无所知,赫歇尔认为,如果达尔文不能解释变异的来源,他就没有真正拥有足以解释物种起源的理论。
自达尔文理论首次问世以来的150年里,关于性状如何传递给后代以及它们如何经历进化变化的关键问题,已通过对基因和基因组研究的显著进展得到解决。今天研究进化生物学的达尔文科学后裔至少了解我们周围动植物美丽多样性的基本分子基础。就像达尔文的理论本身一样,变异的原因通常很简单,但其影响却很深远。恰如其分的是,这些见解是以一系列步骤出现的,其中许多步骤恰好赶上达尔文著作连续的50周年纪念日。
变异揭示
达尔文不仅无法说明变异来自何处,他也没有解释这些新性状如何在后代中传播。他相信混合遗传,即后代具有介于父母之间的特征的想法。但即使是达尔文也认识到这个理论是有问题的,因为如果性状真的混合了,那么任何罕见的新变异都会因与不共享该性状的大量个体进行世代繁殖而被逐渐稀释。
关于混合遗传的困惑在1900年被格雷戈尔·孟德尔对豌豆进行的著名育种实验的重新发现所扫除,这些实验是在19世纪50年代和60年代进行的。奥地利僧侣花园中的不同豌豆植株表现出明显的形态差异,例如茎的粗细、种子的皱纹与光滑等等。当对比类型的纯合豌豆植株杂交时,后代通常类似于两个亲本之一。然而,通过进一步的杂交,性状的两种形式可以在未来的世代中以未稀释的形式重新出现,这表明替代形式的遗传信息没有混合消失。孟德尔的实验改变了人们对可遗传变异的一般看法,从短暂且可混合的实体转变为从父母传递给后代的离散实体,即使它们并不总是可见的,但也存在。
很快,人们饶有兴致地发现,孟德尔的“遗传因子”的遗传模式与细胞核中染色体的行为相呼应。《物种起源》50周年之际,变异的起源仍然未知,但遗传信息正在成为一种物理实体,并且最终可以作为细胞核内的线状物被看到。到该书出版100周年时,染色体中的遗传信息已被追溯到一种叫做脱氧核糖核酸(DNA)的大型酸性聚合物。詹姆斯·D·沃森和弗朗西斯·克里克在1953年提出了DNA分子的结构,这对我们理解遗传和变异的物理基础具有惊人的意义。
DNA是长的双螺旋结构,其骨架由糖和磷酸盐的重复链构成。聚合物的两条链通过四种可能的化学碱基之间的互补配对而结合在一起:腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶(A、C、G、T),它们也构成了简单遗传语言的基础。就像英语字母表中的26个字母一样,DNA字母表中的四个化学字母可以以任何顺序沿着螺旋的一条链出现,拼写出从父母传递给后代的不同指令。
双螺旋结构也为复制遗传信息提供了清晰的机制。C总是与G配对,A与T在DNA分子的中间配对,这些亲和力由相应化学基团的互补大小、形状和结合特性决定。当DNA螺旋的两条链分离时,每条链中的字母序列因此可以用作模板来重建另一条链。
沃森和克里克的DNA结构立即暗示了自发变异的可能物理基础。在细胞分裂之前,DNA分子的物理损伤或复制错误可能会改变其正常的字母序列。突变可以采取许多不同的形式:在聚合物的特定位置将一个字母替换为另一个字母,删除字母块,复制或插入新字母,或倒置和易位已存在的字母。在提出该结构时,这些变化仍然是理论上的。但是,随着达尔文著名著作150周年纪念日的临近,大规模测序方法使得读取整个基因组并以前所未有的细节研究遗传变异(他提出的进化过程的原始材料)成为可能。
通过对各种生物及其后代进行测序,然后寻找从世代传递到世代的DNA长链中发生的任何自发变化,科学家们清楚地表明,这种突变确实相当有规律地发生。(当然,只有发生在生殖细胞中的突变才会传递给后代,因此才能以这种方式检测到。)不同物种的绝对突变率有所不同,但对于单个碱基对替换,通常平均为每核苷酸每代10-8。这个频率听起来可能很低,但许多动植物的基因组都非常庞大。在基因组中具有1亿甚至100亿个碱基对的多细胞动物中,每次遗传信息传递下来时,都可能发生一些自发的单碱基对变化。
基于DNA碱基的化学稳定性和结构特性,特定类型的替换比其他类型的替换更可能发生。此外,某些类型的较大序列变化比单碱基对替换的总体平均速率发生得更频繁。例如,DNA中具有连续八个或更多个相同字母的片段,称为同聚物,在DNA复制过程中非常容易发生复制错误。微卫星区域也是如此,微卫星区域由两个、三个或更多个核苷酸的序列重复组成。
所有这些基因组内的自发变化加起来形成了大量的多样性,即使在同一个物种内也是如此,包括我们自己。在一个历史性的里程碑中,整个人类基因组的三十亿个碱基对的参考序列于2003年完成,四年后,沃森的几乎完整的个人基因组被公布,使得比较两个人的人类序列以及Celera创始人克雷格·文特的基因组序列成为可能,后者的基因组序列也已公开。对这三个序列的并排比较提供了几个有趣的启示。
首先,每个人的基因组与参考序列的差异约为330万个单碱基对变化,这相当于平均每1000个碱基中就有一个变异。尽管较大DNA片段和整个基因的缺失和插入不如单碱基对变化频繁(每个基因组几十万次事件而不是几百万次事件),但这些事件占基因组之间差异的总碱基的大部分,最多影响1500万个碱基对。最近还发现,许多完整的基因组区域在个体之间以不同的拷贝数存在,这反映了基因组结构变异的一个未被重视的水平,科学家们才刚刚开始探索其影响。最后,当比较完整的人类基因组时,看到的序列变化会改变蛋白质编码或调控信息或所有23000个人类基因的拷贝数中的很大一部分,从而为许多人之间性状差异的可能变异提供了丰富的来源。
性状的分子基础
赫歇尔想要一个关于变异如何以及为何产生的答案,然后他才能接受达尔文的理论,即自然选择作用于这些性状,通过完全自然的过程产生新的生物形式。今天,科学家们知道DNA的自发变化是变异的简单“原因”,但这些突变如何转化为性状差异的“方式”的答案更为复杂,并且构成了一个活跃的研究领域,其意义远远超出进化研究。
生物学家现在通常可以将植物和动物的经典形态和生理性状与DNA双螺旋原子中的特定变化联系起来。例如,他们知道孟德尔的高茎豌豆和矮茎豌豆在一个用于赤霉素氧化酶的基因中存在单个G到A的替换。所谓的基因的矮变异改变了酶中的单个氨基酸,这降低了酶活性,并导致豌豆植株茎中生长刺激激素的产生量下降95%。
相比之下,孟德尔的皱缩种子性状是由于在一个与淀粉相关的酶的基因中插入了一个800个碱基对的序列。插入的序列干扰了酶的产生,减少了淀粉的合成,并产生了糖和水分含量的变化,从而导致种子更甜但皱缩。插入的序列也出现在豌豆基因组中的多个其他位置,并且它具有转座元件的所有特征——一段可以从基因组中的一个位置移动到另一个位置的DNA代码块。基因组内这种“跳跃”元件可能是新的遗传变异的又一个常见来源——既可以通过使基因失活,也可以通过创建新的调控序列来改变基因活性模式。
进化生物学家可以对变异的性质做出为数不多的概括之一是,通常无法仅通过观察来判断性状变异的潜在遗传来源。例如,达尔文广泛撰写了关于鸽子、狗和其他家养动物中存在的显着形态差异。今天我们知道,家养动物中有趣的性状是基于许多不同类型的DNA序列变化。
例如,拉布拉多犬黑色和黄色之间的差异源于单个碱基变化,该变化使黄色狗的色素细胞中的信号受体失活。惠比特犬肌肉尺寸的增加和赛跑性能的提高也已追溯到单个碱基对变化,该变化使通常抑制肌肉生长的信号失活。相比之下,罗德西亚脊背犬特殊的背部毛发条纹来自包含三个基因的133,000个碱基对区域的重复,这三个基因编码成纤维细胞生长因子,从而增强了生长因子的产生。
现代达尔文和进化理论的批评者经常认为,个体之间诸如此类的小差异可能是由自然过程产生的,但物种之间较大的结构差异不可能这样做。然而,许多小的变化可以累积成大的变化。此外,某些基因对胚胎发育期间的细胞增殖和细胞分化具有强大的影响,这些控制基因的变化会导致身体部位的大小、形状和数量发生显着变化。进化生物学的一个专门领域,即进化发育生物学(evo-devo),专注于研究重要发育基因变化的影响及其在进化中的作用。
现代玉米植物说明了此类基因的强大影响力,现代玉米植物看起来与中美洲称为类蜀黍的野生杂草祖先完全不同。玉米和类蜀黍之间许多主要的结构差异都映射到少数几个关键染色体区域。控制植物茎发育过程中细胞分裂模式的单个基因的调控区域的突变解释了整体灌木形状和单个中央茎之间的大部分差异。在种子发育过程中活跃的第二个基因的变化有助于将类蜀黍的坚硬的矿物质包裹的种子转化为玉米的更柔软、更裸露的籽粒。当然,古代中美洲农民在对DNA、遗传学或发育一无所知的情况下,从类蜀黍培育出了玉米。但是,通过与具有理想特性的植物交配,他们不知不觉地选择了关键发育控制基因中的自发变异,从而在相对较少的步骤中将灌木状杂草变成了外观完全不同的植物,这对人类农业很有用。
类似的原理是野生刺鱼种群中新的身体形态进化的基础。当最后一个冰河时代在10000年前结束时,海洋鱼类的迁徙种群在北美、欧洲和亚洲无数新形成的湖泊和溪流中定居。此后,这些种群已经经历了大约10000代来适应淡水环境中发现的新食物来源、新捕食者以及新的水色、温度和盐浓度。如今,许多淡水刺鱼物种表现出比不同属鱼类之间更大的结构差异,包括骨板数量或大小的30倍变化、整个鳍的存在或缺失以及下巴和身体形状、牙齿结构、防御性刺和体色的重大变化。
正如玉米一样,最近的遗传研究表明,一些大的形态变化可以映射到少数几个重要的染色体区域。这些区域内的关键基因原来编码发育的中心调控因子。它们包括控制许多不同表面结构形成的信号分子、另一个启动涉及肢体发育的其他基因组的分子以及分泌的干细胞因子,该因子控制胚胎发育过程中前体细胞的迁移和增殖。
新刺鱼多样化形态的总体进化显然涉及多个基因,但在独立的种群中已经反复看到特定发育调控因子中的一些相同变异。因此,这些鱼类对其各自环境的适应很好地证明了随机变异如何产生生物体之间的重大差异,如果这些变化赋予优势,自然选择将一次又一次地保留它们。
原子的偶然结合
人类也可以照镜子,看到自然选择保留的相对较新的变异的更多例子。我们在世界各地不同的环境中以各种颜色出现,最近发现,在北纬地区种群中发现的较浅肤色是几种遗传变化的综合影响造成的,包括在色素细胞中活跃的信号受体和转运蛋白基因中的单碱基突变。还怀疑存在调节新生色素细胞迁移、增殖和存活的其他DNA变化。
两个色素基因侧翼的DNA区域中相对缺乏变异表明,浅肤色变异最初是罕见的,可能起源于少数人。随着古代人类迁移到温度较低、纬度较高的新环境,浅肤色更容易从有限的阳光中产生维生素D,这些变异的频率会迅速增加。
同样,在控制消化乳糖(牛奶中的主要糖)能力的基因周围发现了强烈的分子“选择信号”。人类是哺乳动物,哺乳幼崽并产生一种肠道酶,将乳糖分解为更简单的糖类葡萄糖和半乳糖。人类也是哺乳动物中独一无二的,他们继续使用其他动物的奶作为儿童期以后的重要营养来源。这种文化创新已在欧洲、非洲和中东的群体中独立发生,他们使用来自牛、山羊和骆驼的奶。
成年后消化牛奶的能力取决于肠道乳糖酶基因的突变形式,在大多数哺乳动物和大多数人类群体中,该基因仅在婴儿哺乳期活跃。然而,在具有悠久乳制品畜牧历史的人类群体中,乳糖酶基因的突变形式在成年后继续活跃。这种遗传创新与控制该基因的调控DNA区域中的单碱基对变化有关,但不同的乳糖耐受群体在该关键区域具有不同的突变——这是通过影响一个基因的独立变化反复进化出相似性状的 striking example。
人类近期营养相关适应的另一个例子涉及完整基因的倍增。虽然黑猩猩只有一个唾液淀粉酶基因的拷贝,唾液淀粉酶是一种消化食物中淀粉的酶,但人类携带的淀粉酶基因拷贝数显示出显着差异。在某些个体中,该基因的重复已在单条染色体上产生了多达10个拷贝。与依赖狩猎和捕鱼的文化中的人相比,饮食中富含淀粉的文化(如大米)中的人具有更高的平均淀粉酶基因拷贝数和更高的唾液淀粉酶酶水平。
乳制品畜牧业和农业都起源于过去10000年。尽管这仅相当于大约400代人类,但新的主要营养来源显然已经导致利用这些食物来源的种群中积累了新的遗传变异。
赫歇尔对达尔文理论最持久的反对意见是他认为有用的新性状永远不会从简单的随机变异中出现。在已发表的评论和信件中,他认为这些特征总是需要“思想、计划、设计,以明确且显而易见地排除对该主题的随意看法和原子的偶然结合”。赫歇尔正确地指出,变异的起源在1859年仍然是一个谜。然而,经过150年的额外研究,我们现在可以编目每次复杂基因组从父母传递给后代时发生的各种自发DNA序列变异。
在这些变化中,只有极小一部分可能改善而不是降解原始遗传信息和由此产生的性状。然而,更甜的豌豆、更大的肌肉、更快的跑步能力或提高消化新食物的能力都源于豌豆、狗和人类DNA序列中简单的原子新排列。因此,“原子的偶然结合”显然可以产生有趣的新性状。而生物体固有的变异性继续提供原始材料,通过这种原始材料,用达尔文在他绿色小书结尾处的名言来说,“最美丽和最奇妙的无尽形态,已经进化出来,并且正在进化中。”
注:本文最初印刷时的标题为“从原子到性状”。