数千年前,人类首次迁徙到青藏高原,这是一片广阔的草原,海拔高达约 14,000 英尺。尽管这些开拓者本可以受益于进入一个没有其他人竞争的新生态系统,但那里的低氧水平会对身体造成严重压力,导致慢性高原病和高婴儿死亡率。两年前,一系列基因研究确定了一种基因变异,这种变异在藏族人中很常见,但在其他人群中却很少见。这种变异调节藏族人的红细胞生成,有助于解释该群体如何适应这些恶劣条件。这项发现成为了世界各地的头条新闻,它戏剧性地例证了人类如何在最近的过去经历了对新环境的快速生物学适应。一项研究估计,这种有益的变异在过去 3,000 年内传播到高频率,这在进化意义上只是一瞬间。
西藏的发现似乎支持了一种观点,即自我们这个物种首次离开非洲(估计在 5 万到 10 万年前之间)以来,已经经历了相当大的生物学适应。随着智人从炎热的草原和灌木丛地带迁移到寒冷的苔原、湿热的热带雨林和阳光炙烤的沙漠——几乎是地球上每一种陆地生态系统和气候带,过渡到高海拔只是人类遇到的众多环境挑战之一。可以肯定的是,人类的大部分适应是技术性的——例如,为了抵御寒冷,我们制作了衣服。但是,仅靠史前技术不足以克服稀薄的山地空气、传染病的肆虐和其他环境障碍。在这些情况下,适应必须通过基因进化而不是通过技术解决方案来实现。因此,有理由期望,对我们基因组的调查将揭示大量证据,表明新的基因突变最近已通过自然选择在不同人群中传播开来——也就是说,因为携带这些突变的人比不携带这些突变的人拥有更多健康的婴儿并存活下来进行繁殖。
八年前,我和我的同事开始寻找这些深刻的环境挑战在人类基因组上留下的印记。我们想弄清楚,自从我们的祖先开始他们相对较近的全球旅程以来,人类是如何进化的。世界各地不同地区的人口在基因上有多大程度的差异,是因为自然选择最近使他们适应了不同的环境压力,就像藏族人的情况一样?这些基因差异中有多少比例是源于其他影响?感谢研究基因变异技术的进步,我们得以开始解决这些问题。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的有影响力的故事的未来。
这项工作仍在进行中,但初步发现让我们感到惊讶。事实证明,基因组实际上只包含少数非常强烈、快速的自然选择的例子。相反,基因组中可见的大部分自然选择似乎发生在数万年的时间里。在许多情况下,似乎发生的事情是,一个有益的突变在很久以前为了应对当地的环境压力而在人群中传播开来,然后随着人口扩张到新的领土而被带到遥远的地方。例如,一些与决定浅肤色(对减少阳光的适应)有关的基因变异是根据古代迁徙路线分布的,而不仅仅是纬度。这些古老的选择信号在没有新的环境压力覆盖它们的情况下持续了数千年,这表明自然选择的运作速度通常比科学家预想的要慢得多。藏族人主要基因的快速进化似乎并非典型现象。
作为一名进化生物学家,我经常被问到人类今天是否仍在进化。我们当然还在进化。但是,关于我们如何变化的问题的答案要复杂得多。我们的数据表明,经典的自然选择情景,即单个有益的突变像野火一样在人群中蔓延,实际上在过去 6 万年中在人类中发生得相对较少。相反,这种进化变化的机制通常似乎需要在数万年的时间里持续存在的环境压力——一旦我们的祖先开始环球旅行,技术创新的步伐开始加快,这种情况就不常见了。
这些发现已经帮助我们改进了对近期人类进化以及我们集体未来可能走向的理解。对于我们物种目前面临的许多挑战——例如全球气候变化和许多传染病——自然选择可能发生得太慢,无法对我们有太大帮助。相反,我们将不得不依靠文化和技术。
[分隔符] 寻找足迹
就在十年前,科学家们要追踪我们物种对环境的基因反应极其困难;所需的工具根本不存在。随着人类基因组序列的完成以及随后的基因变异编目,这一切都发生了变化。为了确切地理解我们所做的事情,了解一些关于 DNA 结构以及微小变化如何影响其功能的信息会有所帮助。人类基因组序列由约 30 亿对 DNA 核苷酸或“字母”组成,它们充当组装人类的说明手册[见上方方框]。现在已知该手册包含约 20,000 个基因的零件清单——DNA 字母串,拼写出构建蛋白质所需的信息。(蛋白质,包括酶,在细胞中完成大部分工作。)大约 2% 的人类基因组编码蛋白质,并且略大的比例参与基因调控。基因组的其余大部分没有已知作用。
总的来说,任何两个人的基因组都极其相似,每 1,000 个核苷酸对中只有大约一个不同。一个核苷酸对被另一个核苷酸对替换的位置被称为单核苷酸多态性或 SNP(发音为“snips”),每个 SNP 处的 DNA 替代版本称为等位基因。由于基因组的大部分不编码蛋白质或调节基因,因此大多数 SNP 可能对个体没有可测量的影响。但是,如果 SNP 发生在基因组中确实具有编码或调节功能的区域,则它可能会影响蛋白质的结构或功能,或者影响蛋白质的制造位置和数量。通过这种方式,SNP 可以想象地改变几乎任何特征,无论是身高、眼睛颜色、消化牛奶的能力,还是对糖尿病、精神分裂症、疟疾和 HIV 等疾病的易感性。
当自然选择强烈偏爱特定等位基因时,它在每一代中都变得在人群中更常见,而不受青睐的等位基因变得不太常见。最终,如果环境保持稳定,有益的等位基因将传播开来,直到群体中的每个人都携带它,此时它已在该群体中被固定下来。这个过程通常需要很多代。如果一个携带两个有益等位基因副本的人平均比没有有益等位基因的人多生育 10% 的孩子,而一个携带一个副本的人多生育 5% 的孩子,那么该等位基因大约需要 200 代或大约 5,000 年才能从人口的 1% 增加到 99%。从理论上讲,如果一个有用的等位基因赋予了非常大的优势,它可以在短短几百年内被固定下来。相反,一个不太有利的等位基因可能需要数千年的时间才能传播开来。
如果我们能够在努力理解近期人类进化的过程中,从古代遗骸中获得 DNA 样本,并实际追踪受青睐等位基因随时间的变化,那将是极好的。但是 DNA 通常在古代样本中会迅速降解,从而阻碍了这种方法。因此,我的研究小组和世界各地的许多其他小组开发了检查现代人类基因变异的方法,以寻找过去发生的自然选择迹象。
一种这样的策略是从许多不同人的 DNA 数据中梳理出在人群中 SNP 等位基因差异很小的片段。当一个新的有益突变因自然选择而在群体中迅速传播时,它会通过一种称为基因搭便车的过程,带走周围的一大块染色体。随着有益等位基因在群体中频率随时间增加,附近“中性”和几乎中性的等位基因的频率也随之增加,这些等位基因不会显着影响蛋白质结构或数量,但会与选择的等位基因一起搭便车。基因组中包含有益等位基因的区域中 SNP 变异的由此减少或消除称为选择性清除。自然选择对选定等位基因的传播也可能在 SNP 数据中留下其他独特的模式:如果一个现有等位基因在人群发现自己处于新环境时突然证明特别有用,则该等位基因可以达到高频率(同时在其他人群中仍然罕见),而无需必然产生搭便车信号。
在过去几年中,包括我和我的同事在 2006 年发表的一项研究在内的多项研究,已经识别出数百个明显的自然选择基因组信号,这些信号发生在过去 6 万年左右——也就是说,自从智人离开非洲以来。在这些案例中的少数几个案例中,科学家们对选择压力和受青睐等位基因的适应性益处有很好的把握。例如,在欧洲、中东和东非的奶牛养殖人群中,基因组中容纳消化乳糖(牛奶中的糖)的乳糖酶基因的区域显示出明显的目标选择迹象。在大多数人群中,婴儿天生就具有消化乳糖的能力,但乳糖酶基因在断奶后会关闭,使人们成年后无法消化乳糖。2004 年,在《美国人类遗传学杂志》上发表的一篇文章中,麻省理工学院的一个团队估计,在欧洲奶牛养殖群体中,乳糖酶基因的变体在成年期保持活跃,在短短 5,000 到 10,000 年内就达到了高频率。2006 年,现在在宾夕法尼亚大学的 Sarah Tishkoff 领导的一个小组在《自然遗传学》杂志上报道说,他们已经在东非奶牛养殖人群中发现了乳糖酶基因的快速进化。这些变化无疑是对一种新的生存实践的适应性反应。
研究人员还在至少六个与决定非裔人群的皮肤、头发和眼睛颜色有关的基因中发现了明显的选择信号。在这里,选择压力和适应性益处也很明显。随着人类走出热带家园,他们从太阳那里接收到的紫外线辐射减少了。身体需要紫外线辐射来合成维生素 D,这是一种必需的营养素。在热带地区,紫外线辐射足够强,可以穿透深色皮肤,达到维生素 D 合成所需的量。在高纬度地区则不然。吸收足够量的维生素 D 的需求几乎肯定推动了这些地区较浅肤色的进化,而这些基因中带有强烈选择信号的变化促成了这种适应性转变。
选择信号也出现在多种赋予对传染病抵抗力的基因中。例如,哈佛大学的 Pardis Sabeti 和她的同事发现,在所谓的LARGE基因中存在一种突变,该突变最近已传播到尼日利亚约鲁巴人群中的高频率,这可能是对拉沙热在该地区相对近期出现的反应。
[分隔符] 混合信号
这些例子和少数其他案例为自然选择迅速行动以促进有益等位基因提供了强有力的证据。然而,对于数百个候选信号中的大多数,我们尚不清楚哪些环境因素有利于受选择等位基因的传播,也不知道该等位基因对携带它的人有什么影响。直到最近,我们和其他人还将这些候选信号解释为意味着在过去 15,000 年中,在我们研究的几个人群中,至少发生了数百次非常快速的选择性清除。但在较新的工作中,我和我的同事发现了证据表明,相反,这些信号中的大多数实际上并非最近对当地条件进行快速适应的结果。
我们与斯坦福大学的合作者一起研究了一个庞大的 SNP 数据集,该数据集来自从世界各地约 1,000 人那里获得的 DNA 样本。当我们查看选定等位基因的地理分布时,我们发现最明显的信号往往属于仅有的三种地理模式之一。首先是所谓的非洲以外清除,其中受青睐的等位基因及其搭便车基因在所有非非洲人群中都以高频率存在[见前两页的方框]。这种模式表明,适应性等位基因出现在人类离开非洲后不久,但在他们仍然局限于中东地区时就开始传播——因此可能在大约 6 万年前——并且随着人类向北和向东迁移而被带到世界各地。然后还有其他两种更受限制的地理模式:西欧亚清除,其中受青睐的等位基因在欧洲、中东、中亚和南亚的所有人群中都以高频率出现,但在其他地方则不然;以及东亚清除,其中受青睐的等位基因在东亚人中最常见,通常也在美洲原住民、美拉尼西亚人和巴布亚人中最常见。这两种模式可能代表在西欧亚人和东亚人分裂并各奔东西后不久开始的清除。(尚不清楚这发生在何时,但可能在大约 2 万到 3 万年前。)
这些清除模式揭示了一些非常有趣的事情:古代人口迁移严重影响了受青睐等位基因在全球的分布,而自然选择几乎没有对这些分布进行微调以适应现代环境压力。例如,适应浅肤色的最重要的参与者之一是所谓的SLC24A5基因的变体。由于它是对减少阳光的适应,人们可能会期望其在人群中的频率随着纬度的增加而增加,并且其分布在来自北亚和北欧的人群中相似。相反,我们看到了西欧亚清除:基因变体和与之同行的搭便车 DNA 在从巴基斯坦到法国的人群中都很常见,但在东亚(即使在北部纬度地区)基本上不存在。这种分布表明,有益的变异出现在西欧亚人的祖先人群中——在他们与东亚人的祖先分道扬镳之后——他们将它带到了整个地区。因此,自然选择早期推动了有益的SLC24A5等位基因达到高频率,但古代人口历史帮助决定了今天哪些人群拥有它,哪些人群没有。(其他基因解释了东亚人的浅肤色。)
更仔细地观察这些和其他数据中的选择信号,可以发现另一种奇怪的模式。人群之间频率差异最极端的等位基因——例如,那些几乎在所有亚洲人中都存在但在非洲人中不存在的等位基因——并没有表现出人们期望看到的强烈搭便车信号,如果自然选择迅速推动这些新的等位基因达到高频率的话。相反,这些等位基因似乎在我们物种从非洲出发后的大约 6 万年间逐渐传播开来。鉴于这些观察结果,我和我的合作者现在认为,教科书式的选择性清除——其中自然选择推动有利的新突变迅速固定下来——实际上自从智人大 diaspora 开始以来发生得相当罕见。我们怀疑自然选择通常对单个等位基因的作用相对较弱,因此非常缓慢地促进它们。因此,大多数承受选择压力的等位基因可能只有在压力持续数万年时才能达到高频率。
[分隔符] 一个性状,多个基因
我们的结论可能看起来是自相矛盾的:如果一个有用的等位基因在人群中传播开来通常需要 5 万年而不是 5,000 年,那么人类如何才能快速适应新条件呢?尽管最容易理解的适应源于单个基因的变化,但大多数适应可能并非以这种方式产生,而是源于对基因组中数百或数千个相关基因产生轻微影响的基因变异——也就是说,它们是多基因的。例如,2010 年发表的一篇论文确定了 180 多个不同的基因影响人类身高,当然还有更多的基因有待发现。对于这些基因中的每一个,一个等位基因与另一个等位基因相比,平均身高仅增加约 1 到 5 毫米。
当自然选择以人类身高为目标时——就像非洲、东南亚和南美洲雨林栖息地的俾格米人群中发生的那样,在那里,小体型可能是对这些环境中有限营养的适应——它可能在很大程度上通过调整来自基因组中数百个不同基因的等位基因频率来运作。如果每个身高基因的“矮”版本都变得仅常见 10%,那么人群中的大多数人将拥有更多数量的“矮”等位基因,并且人群总体上会更矮。即使总体性状受到强烈的选择,作用于每个个体身高基因的选择强度仍然会很弱。由于作用于任何一个基因的选择都很弱,多基因适应不会在基因组研究中显示为经典的选择信号。因此,人类基因组最近可能经历了比科学家通过通常方式检查基因组所能识别的更多的适应性变化。
[分隔符] 仍在进化?
至于人类是否仍在进化,很难捕捉到自然选择正在塑造当今人群的行为。然而,很容易想象可能受到影响的特征。疟疾和 HIV 等传染病继续在发展中国家施加强大的选择力量。少数已知的基因变异可以提供一定程度的保护,以抵御这些祸害,它们可能正在受到强大的选择压力,因为携带它们的人比不携带它们的人更有可能生存下来并活到生育更多孩子。一种可以保护携带者免受间日疟形式疟疾侵害的变异已经在撒哈拉以南非洲的许多人群中变得普遍。与此同时,如果 HIV 持续存在并继续受到该抗性基因的阻碍,那么保护免受 HIV 侵害的变异可能会在数百年内在撒哈拉以南非洲地区传播开来。但鉴于 HIV 的进化速度快于人类,我们更有可能通过技术(例如疫苗的形式)而不是通过自然选择来克服这个问题。
在发达国家,出生到成年期间死亡的人相对较少,因此一些最强大的选择力量可能作用于影响每个人生育孩子数量的基因。原则上,遗传变异影响的任何生育能力或生殖行为方面都可能成为自然选择的目标。耶鲁大学的 Stephen C. Stearns 和他的同事在 2009 年的《美国国家科学院院刊》上发表了一篇论文,报告了一项研究的结果,该研究确定了女性的六种不同特征,这些特征与更高的终生子女数量有关,并且都显示出中等到高的遗传力。该团队发现,生育子女较多的女性往往比平均水平略矮且更健壮,并且更年期的年龄也较晚。因此,如果环境保持不变,这些特征可能会随着时间的推移因自然选择而变得更加普遍:作者估计,在未来 10 代或 200 年内,平均更年期年龄将增加约一年。(更具推测性的是,影响性行为或避孕措施使用的基因变异很可能受到强烈的选择,尽管基因在多大程度上影响此类复杂的行为仍不清楚。)
尽管如此,大多数性状的变化速度与我们改变文化和技术以及全球环境的速度相比,仍然是极其缓慢的。而重大的适应性转变需要跨越数千年的稳定条件。因此,5,000 年后的未来,人类的环境无疑将大相径庭。但在没有大规模基因组工程的情况下,人类自身可能在很大程度上仍然保持不变。