数千年前,人类首次迁徙到青藏高原,这是一片广阔的草原,海拔高达约 14,000 英尺。尽管这些开拓者可以受益于进入一个没有其他人竞争的新生态系统,但高海拔地区的低氧水平会对身体造成严重压力,导致慢性高原病和高婴儿死亡率。今年早些时候,一系列基因研究发现了一种基因变异,这种变异在藏族人中很常见,但在其他人群中却很少见。这种变异调节藏族人的红细胞生成,有助于解释藏族人如何适应这些恶劣条件。这一发现成为世界各地的头条新闻,为人类如何在最近的过去对新的环境条件进行快速生物适应提供了一个引人注目的例子。一项研究估计,这种有益的变异在过去 3000 年中迅速传播到高频率——这在进化意义上只是一瞬间。
西藏的发现似乎支持了这样一种观点,即自从我们这个物种大约在 6 万年前(估计范围从 5 万到 10 万年前)首次离开非洲以来,已经经历了相当大的生物适应。从东非炎热的草原和灌木丛到寒冷的苔原、蒸汽腾腾的雨林和阳光炙烤的沙漠——几乎地球上每个陆地生态系统和气候带,智人都在迁徙过程中遇到了许多环境挑战。可以肯定的是,人类的许多适应都是技术性的——例如,为了御寒,我们制作了衣服。但是,仅靠史前技术不足以克服稀薄的山地空气、传染病的蹂躏和其他环境障碍。在这些情况下,适应必须通过基因进化而不是通过技术解决方案来发生。因此,有理由期望,对我们基因组的调查将揭示大量新的基因突变的证据,这些突变最近通过自然选择在不同人群中传播开来——也就是说,因为携带这些突变的人比不携带这些突变的人拥有更多健康的、能够存活下来并繁殖的后代。
六年前,我和我的同事开始寻找这些深刻的环境挑战在人类基因组上留下的印记。我们想弄清楚,自从我们的祖先开始他们相对较晚的全球旅程以来,人类是如何进化的。世界各地不同地区的人群在基因上的差异在多大程度上是因为自然选择最近使他们适应了不同的环境压力,就像藏族人的情况一样?这些基因差异中有多少比例是源于其他影响?得益于研究基因变异的技术进步,我们得以开始解决这些问题。
支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
这项工作仍在进行中,但初步发现让我们感到惊讶。事实证明,基因组实际上包含很少非常强烈、快速自然选择的例子。相反,基因组中可见的大多数自然选择似乎发生在数万年前。在许多情况下,似乎发生的情况是,一个有益的突变在很久以前就为了应对当地的环境压力而在人群中传播开来,然后随着人口扩张到新的领土而被带到遥远的地方。例如,一些与决定浅肤色(对减少阳光的适应)有关的基因变异是根据古代的迁徙路线而不是仅仅根据纬度分布的。这些古老的选择信号在没有新的环境压力覆盖它们的情况下持续了数千年,这表明自然选择的运作速度通常比科学家们设想的要慢得多。藏族人主要基因的快速进化似乎并非典型现象。
作为一名进化生物学家,我经常被问到人类今天是否仍在进化。我们当然还在进化。但是,关于我们如何变化的问题的答案要复杂得多。我们的数据表明,经典的自然选择情景,即单个有益的突变像野火一样在人群中蔓延,实际上在过去 6 万年中在人类中相对罕见。相反,这种进化变化机制通常似乎需要数万年的持续环境压力——一旦我们的祖先开始环球旅行并且技术创新步伐开始加速,这种情况就变得不常见了。
这些发现已经开始帮助我们完善对近期人类进化以及我们共同未来可能走向的理解。对于我们物种目前面临的许多挑战——例如全球气候变化和许多传染病——自然选择可能发生得太慢,无法对我们有太大帮助。相反,我们将不得不依靠文化和技术。
寻找足迹
仅仅在 10 年前,科学家们还极其难以追踪我们物种对环境的基因反应;所需的工具根本不存在。随着人类基因组序列的完成以及随后的基因变异编目,这一切都发生了变化。要准确了解我们所做的事情,了解一些关于 DNA 结构以及微小变化如何影响其功能是有帮助的。人类基因组序列由约 30 亿对 DNA 核苷酸或“字母”组成,这些核苷酸或“字母”充当如何组装人类的说明手册。现在已知该手册包含约 20,000 个基因的零件清单——DNA 字母串,拼写出构建蛋白质所需的信息。(蛋白质,包括酶,在细胞中完成大部分工作。)大约 2% 的人类基因组编码蛋白质,大约相同数量的基因组似乎参与基因调控。基因组其余部分的大部分没有已知作用。
总体而言,任何两个人的基因组都非常相似,每 1000 个核苷酸对中仅相差约一个。一个核苷酸对被另一个核苷酸对取代的位置称为单核苷酸多态性或 SNP(发音为“snips”),每个 SNP 的 DNA 替代版本称为等位基因。由于基因组的大部分不编码蛋白质或调节基因,因此大多数 SNP 可能对个体没有可测量的影响。但是,如果 SNP 发生在基因组中具有编码或调节功能的区域,则可能会影响蛋白质的结构或功能,或者蛋白质的产生位置和数量。通过这种方式,SNP 可以想象地修改几乎任何性状,无论是身高、眼睛颜色、消化牛奶的能力,还是对糖尿病、精神分裂症、疟疾和艾滋病毒等疾病的易感性。
当自然选择强烈偏爱特定等位基因时,它在人群中每一代都变得更加常见,而不受青睐的等位基因变得越来越不常见。最终,如果环境保持稳定,有益的等位基因将传播开来,直到人群中的每个人都携带它为止,此时它已在该群体中固定下来。这个过程通常需要许多代。如果一个携带两个有益等位基因副本的人平均比没有有益等位基因的人多生育 10% 的孩子,而一个携带一个副本的人平均多生育 5% 的孩子,那么该等位基因大约需要 200 代或大约 5000 年才能从人群的 1% 增加到 99%。从理论上讲,如果一个有益的等位基因赋予了非凡的优势,那么它可以在短短几百年内固定下来。相反,一个不太有利的等位基因可能需要数千年才能传播。
如果我们能够从古代遗骸中获得 DNA 样本,并实际追踪受青睐的等位基因随时间的变化,那将非常有助于我们理解近期人类进化。但是,DNA 通常会在古代样本中迅速降解,从而阻碍了这种方法。因此,我的研究小组和世界各地的许多其他小组开发了检查现代人类基因变异的方法,以寻找过去发生的自然选择的迹象。
一种这样的策略是从许多不同人的 DNA 数据中梳理出在人群内 SNP 等位基因差异很小的片段。当一个新的有益突变由于自然选择而在人群中迅速传播时,它会通过一种称为基因搭便车的过程中带走周围染色体的一段。随着有益等位基因在群体中频率随时间增加,附近的“中性”和几乎中性的等位基因的频率也随之增加,这些等位基因不会明显影响蛋白质结构或数量,但会与选择的等位基因一起搭便车。基因组中包含有益等位基因的区域中 SNP 变异的由此减少或消除称为选择性清除。自然选择选择的等位基因的传播也可能在 SNP 数据中留下其他独特的模式:如果一个现有的等位基因在人群发现自己处于新环境时突然证明特别有用,那么该等位基因可以达到高频率(同时在其他人群中仍然罕见),而不必产生搭便车信号。
在过去几年中,包括我和我的同事在 2006 年发表的一项研究在内的多项研究,已经识别出数百个在过去 6 万年左右发生的明显自然选择的基因组信号——也就是说,自从智人离开非洲以来。在其中一些案例中,科学家们对选择压力和受青睐的等位基因的适应性益处有相当好的把握。例如,在欧洲、中东和东非的奶牛养殖人群中,基因组中容纳消化乳糖(牛奶中的糖)的乳糖酶基因的区域显示出明显的目标选择迹象。在大多数人群中,婴儿天生具有消化乳糖的能力,但乳糖酶基因在断奶后会关闭,导致人们成年后无法消化乳糖。在 2004 年的《美国人类遗传学杂志》上,麻省理工学院的一个团队估计,在欧洲奶牛养殖群体中,在成年后仍保持活性的乳糖酶基因变异在短短 5000 到 10000 年内就达到了高频率。2006 年,由莎拉·蒂什科夫(Sarah Tishkoff,现任宾夕法尼亚大学)领导的一个小组在《自然遗传学》杂志上报告说,他们发现东非奶牛养殖人群中乳糖酶基因的快速进化。这些变化无疑是对新的生存实践的适应性反应。
研究人员还在至少六个参与决定非裔人群皮肤、头发和眼睛颜色的基因中发现了明显的选择信号。在这里,选择压力和适应性益处也很明显。当人类离开他们的热带家园时,他们从太阳那里接收到的紫外线辐射减少了。身体需要紫外线辐射来合成维生素 D,这是一种必需的营养素。在热带地区,紫外线辐射足够强,可以穿透深色皮肤,达到维生素 D 合成所需的量。但在较高纬度地区并非如此。吸收足够量维生素 D 的需求几乎肯定推动了这些地区较浅肤色的进化,而这些基因中带有强烈选择信号的变化使这种适应性转变成为可能。
选择信号也出现在多种赋予对传染病抵抗力的基因中。例如,哈佛大学的帕尔迪斯·萨贝蒂(Pardis Sabeti)和她的同事发现了一种所谓的LARGE基因中的突变,该突变最近已在尼日利亚的约鲁巴人中传播到高频率,这可能是对该地区相对较近出现的拉沙热的一种反应。
混合信号
这些例子和其他少数案例为自然选择快速促进有益等位基因提供了有力的证据。然而,对于其余数百个候选信号中的大多数,我们尚不知道哪些情况有利于受选择等位基因的传播,也不知道该等位基因对携带它的人有何影响。直到最近,我们和其他人还将这些候选信号解释为意味着在过去 15,000 年中,在已研究的几个人群中,至少发生了数百次非常快速的选择性清除。但是在较新的工作中,我和我的同事发现证据表明,相反,这些信号中的大多数实际上并非完全是近期快速适应当地条件的结果。
我们与斯坦福大学的合作者合作,研究了从来自世界各地约 1000 个个体的 DNA 样本生成的大量 SNP 数据集。当我们查看受选择等位基因的地理分布时,我们发现最明显的信号往往只属于三种地理模式之一。首先是所谓的非洲境外清除,其中受青睐的等位基因及其搭便车基因以高频率存在于所有非裔人群中。这种模式表明,适应性等位基因出现在人类离开非洲后不久,但在他们仍然局限于中东地区时——因此可能在大约 6 万年前——并随着人类向北和向东迁徙而被带到全球各地。然后还有其他两种更受限制的地理模式:西欧亚清除,其中受青睐的等位基因以高频率出现在欧洲、中东、中亚和南亚的所有人群中,但在其他地方则不然;以及东亚清除,其中受青睐的等位基因在东亚人中最常见,通常也在美洲原住民、美拉尼西亚人和巴布亚人中常见。这两种模式可能代表了在西欧亚人和东亚人分裂并各自走上道路后不久开始的清除。(尚不清楚这种情况何时确切发生,但可能在大约 2 万到 3 万年前。)
这些清除模式揭示了一些非常有趣的事情:古代人口迁移严重影响了受青睐的等位基因在全球的分布,而自然选择在微调这些分布以匹配现代环境压力方面做得很少。例如,适应浅肤色的最重要的因素之一是所谓的SLC24A5基因的一种变异。由于它是对减少阳光的适应,人们可能会期望其在人群中的频率随着纬度的增加而增加,并且其分布在来自北亚和北欧的人群中相似。相反,我们看到的是西欧亚清除:该基因变异和随之而来的搭便车 DNA 在从巴基斯坦到法国的人群中很常见,但在东亚——即使在北部纬度地区——基本上不存在。这种分布表明,有益的变异出现在西欧亚人的祖先人群中——在他们与东亚人的祖先分道扬镳之后——他们将它带到了整个地区。因此,自然选择早期推动了有益的SLC24A5等位基因达到高频率,但古代人口历史帮助决定了今天哪些人群拥有它,哪些人群没有。(其他基因解释了东亚人的浅肤色。)
更仔细地观察这些数据和其他数据中的选择信号,就会发现另一种奇怪的模式。人群之间频率差异最极端的等位基因——例如,那些几乎在所有亚洲人中都存在但在非洲人中不存在的等位基因——并没有表现出人们期望在自然选择迅速推动这些新等位基因达到高频率时会看到的强烈搭便车信号。相反,这些等位基因似乎在自从我们物种从非洲出发以来大约 6 万年的时间里逐渐传播开来。
鉴于这些观察结果,我和我的合作者现在认为,教科书式的选择性清除——其中自然选择推动一个有利的新突变迅速固定下来——实际上在智人散布开始以来发生得相当罕见。我们怀疑自然选择通常对单个等位基因的作用相对较弱,因此非常缓慢地促进它们。因此,大多数经历选择压力的等位基因可能只有在压力持续数万年时才能达到高频率。
一个性状,多个基因
我们的结论可能看起来自相矛盾:如果一个有益的等位基因传播到人群中通常需要 5 万年而不是 5000 年,那么人类如何能够快速适应新条件?尽管最容易理解的适应来自单个基因的变化,但大多数适应可能并非以这种方式产生,而是来自对基因组中数百或数千个相关基因具有轻微影响的基因变异——也就是说,它们是多基因的。例如,2008 年发表的一系列论文确定了 50 多个影响人类身高的不同基因,而且肯定还有更多基因有待发现。对于这些基因中的每一个,一个等位基因与另一个等位基因相比,平均身高仅增加三到五毫米。
当自然选择以人类身高为目标时——正如非洲、东南亚和南美洲雨林栖息地中居住的俾格米人群中发生的那样,在那里,矮小的身材可能是对这些环境中有限营养的适应——它可能在很大程度上通过调整来自基因组各处的数百个不同基因的等位基因频率来运作。如果每个身高基因的“矮”版本变得只常见 10%,那么人群中的大多数人很快就会拥有更多的“矮”等位基因,并且人群的总体身高会更矮。即使整体性状受到强烈的选择,作用于任何一个身高基因的选择强度仍然很弱。由于作用于任何一个基因的选择都很弱,因此多基因适应不会在基因组研究中显示为经典的选择信号。因此,人类基因组最近可能经历了比科学家们通过通常方式检查基因组所能识别的更多的适应性变化。
仍在进化?
至于人类是否仍在进化,很难捕捉到自然选择塑造当今人群的行为。然而,很容易想象可能受到影响的性状。疟疾和艾滋病毒等传染病继续在发展中国家施加强大的选择力量。少数已知的基因变异提供了一定程度的保护,以抵抗这些灾难,它们可能正处于强大的选择压力之下,因为携带它们的人比不携带它们的人更有可能生存并活到生育更多后代。一种保护携带者免受间日疟形式疟疾侵害的变异已在撒哈拉以南非洲的许多人群中变得普遍。与此同时,如果艾滋病毒持续存在并继续受到该抗性基因的阻碍,那么保护人们免受艾滋病毒侵害的变异可能会在数百年内在撒哈拉以南非洲传播开来。但鉴于艾滋病毒的进化速度快于人类,我们更有可能通过技术(以疫苗的形式)而不是通过自然选择来克服这个问题。
在发达国家,出生到成年之间死亡的人相对较少,因此一些最强的选择力量可能作用于影响每个人生育孩子数量的基因。原则上,遗传变异影响的任何生育能力或生殖行为方面都可能是自然选择的目标。在 2009 年的《美国国家科学院院刊》上,耶鲁大学的斯蒂芬·C·斯特恩斯(Stephen C. Stearns)和他的同事报告了一项研究的结果,该研究确定了女性的六种不同性状,这些性状与更高的终生子女数量相关,并且都表现出中等到高的遗传力。该团队发现,子女数量较多的女性往往比平均身高略矮且更健壮,并且绝经年龄较晚。因此,如果环境保持不变,由于自然选择,这些性状可能会随着时间的推移变得更加常见:作者估计,在未来 10 代或 200 年内,平均绝经年龄将增加约一年。(更具推测性的是,影响性行为或避孕药具使用的基因变异可能受到强烈的选择,尽管基因在多大程度上影响这些复杂的行为仍然不清楚。)
尽管如此,与我们改变文化和技术以及当然还有我们的全球环境的速度相比,大多数性状的变化速度都慢如冰川。而主要的适应性转变需要跨越千年的稳定条件。因此,从现在起 5000 年后,人类环境无疑将大不相同。但在没有大规模基因组工程的情况下,人类自身可能在很大程度上保持不变。