当具有开创性意义的遗传学家芭芭拉·麦克林托克于 1902 年出生在康涅狄格州哈特福德时,她的父母最初给她取名为埃莉诺。但他们很快觉得这个名字对他们的女儿来说太娇弱了,于是开始改叫她芭芭拉,他们认为这个名字更适合她坚强的个性。她的父母准确地预言了她的决心。
说麦克林托克是一位先驱还是轻描淡写了。1944 年,她成为第三位当选为美国国家科学院院士的女性,也是第一位领导美国遗传学学会的女性。此后不久,她发现玉米中的某些遗传区域可以在染色体上跳跃,从而影响杂色玉米穗的颜色,玉米粒的颜色范围从金黄色到深紫色。她将这些跳跃的遗传密码片段称为“控制单元”,后来被称为转座子或可转座元件。不幸的是,到 20 世纪 50 年代中期,麦克林托克开始感觉到科学界主流尚未准备好接受她的想法,她停止发表对该领域的研究,以避免与科学机构疏远。但科学思想可以重新出现并融入主流,30 年后,麦克林托克因她对这些移动的遗传密码块的革命性见解而获得诺贝尔生理学或医学奖。
近年来,医学研究发现了新的证据,表明人类基因组中的移动部分可能导致危及生命的疾病,范围从癌症到糖尿病。例如,一些血友病病例已被追溯到可转座元件,这些元件在患者出生前,甚至可能在受孕前,插入自身并破坏了促进血液凝固的基因。与此同时,实验也提供了越来越多的数据,表明某些可转座元件——以及这些游走的 DNA 片段帮助复活的基因——具有有益的作用。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们今天世界的发现和想法的有影响力的故事的未来。
俄勒冈健康与科学大学波特兰分校研究这些 DNA 片段的博士后研究员乔什·迈耶表示,对可转座元件的研究是“研究的热点”。他解释说:“早在该领域的早期,这些东西的通用类别就是垃圾 DNA。” 现在,他说,研究人员已经开始理解,可转座元件并非总是中性的遗传成分:“转座子生物学家最喜欢做的就是讨论这些东西对我们来说总体上是坏事还是好事。”
自从麦克林托克取得突破以来,研究人员已经在他们寻找过的每种生物的基因组中识别出不同类别的可转座元件,范围从果蝇到北极熊。大约 3% 的人类基因组由 DNA 起源的转座子组成,这与麦克林托克在玉米中研究的转座子属于同一类。另一种类型的可转座元件,称为逆转座子,在我们基因组中更为丰富。这些包括源自病毒的可转座元件,占人类基因组的 10% 之多1。这些元件通常可以追溯到数千年前。当病毒整合到精子或卵细胞的基因组中时,它们就会产生,并因此从一代传到下一代。

玉米的惊人洞察力:1947 年的麦克林托克。图片来源:Everett Collection Historical Alamy
基因组中“化石化”的古老病毒在很大程度上保持休眠状态,并随着时间推移而退化。然而,有迹象表明,它们可能具有重新出现并导致疾病的能力,一些科学家表示,这些疾病可能包括自身免疫性疾病和精神分裂症2。在一个例子中,2015 年的一项研究发现,在肌萎缩侧索硬化症(也称为卢伽雷氏病)患者的大脑中,一种名为人类内源性逆转录病毒 K 的嵌入病毒水平升高3。然而,研究人员强调,这些数据尚未建立因果联系。
另一种称为长散布核元件-1 或简称 LINE-1 的逆转座子类别,占人类基因组的惊人的 17% 或更多4。当 LINE-1 逆转座子在生殖细胞的基因组内移动并将自身插入新位置时,它们会破坏重要的基因。研究人员迄今已发现超过 120 个 LINE-1 基因插入,导致疾病范围从肌营养不良症到囊性纤维化5。
对可转座元件(尤其是内源性逆转录病毒和 LINE-1)的大部分关注都集中在这些 DNA 插入可能产生的负面影响上。但追溯到 20 世纪 80 年代的工作表明,内源性逆转录病毒也可能在某种程度上支持生殖功能6。2000 年,科学家发现人类基因组中一种古老病毒的残余物编码一种名为合胞素的蛋白质,细胞实验表明该蛋白质对胎盘发育很重要7。虽然尚未明确显示,但也有迹象表明,嵌入灵长类动物祖先 DNA 中的内源性逆转录病毒可能有助于提高唾液中消化酶淀粉酶的产量,淀粉酶有助于分解淀粉8, 9。
为了更深入地了解可转座元件对人类的影响,犹他大学盐湖城分校的遗传学家内尔斯·埃尔德和他的同事使用 CRISPR-Cas9 基因编辑技术靶向一种名为 MER41 的内源性逆转录病毒,据信该病毒来自大约 6000 万年前整合到基因组中的病毒。科学家们从培养皿中培养的人类细胞中去除了 MER41 元件。在人类中,MER41 出现在参与干扰素反应的基因附近,干扰素是一种信号分子,有助于我们的免疫系统对抗病原体。值得注意的是,与正常细胞相比,经过基因工程改造后缺乏 MER41 的细胞更容易受到牛痘病毒的感染,牛痘病毒用于为人们接种天花疫苗。去年报告的这些发现表明,MER41 在通过干扰素途径触发细胞启动针对病原体的免疫反应中起着至关重要的作用10。
迈耶强调,这些见解提升了麦克林托克已经非常杰出的发现。“我希望她会感到非常欣慰和被证明是正确的,”他说。“她认识到了一种基因组活力的因素,这是以前没有人见过的。我坚信,它只会变得越来越重要,并且越来越成为我们理解基因组如何工作的核心。”
复古设计
2005 年,内尔斯·埃尔德获得了分子遗传学博士学位,在西雅图找到了一份研究员的工作,任务是研究长臂猿(一种猿类)免疫系统的进化。每天早上,当他骑自行车去市中心的实验室时,他都会经过城市动物园,听到里面的长臂猿互相呼唤。偶尔,他会去动物园看看它们,但他当时并不知道,他在那里看到的松鼠猴会在他未来的研究中占据如此重要的地位。在工作中,埃尔德的灵长类动物研究重点是他负责使用测序设备提取和分析的长臂猿 DNA。
六年前,埃尔德收到了他的第一个实验室,在犹他大学运营。他没想到他的团队在那里的第一个发现会来得如此迅速,或者会涉及到可转座元件。埃尔德来到这所大学的目的是学习细胞如何识别和击败入侵病毒,例如 HIV。但他还没有获得运行实验所需的设备,尽管他已经有两名渴望工作的员工,包括他的实验室经理黛安·唐豪尔。由于缺乏实验室工具,这两名实验室工作人员将时间花在电脑上,在数据库中寻找 DNA 中有趣的模式。仅仅两周后,唐豪尔走进埃尔德的办公室,告诉他,他们在新世界猴子中发现了几份特定基因的额外拷贝——特别是松鼠猴。
埃尔德最初对唐豪尔的见解不以为然。“我说,‘你为什么不回到实验室,不要担心它呢?’”他回忆道。但几天后,她带着这个想法回到了他的办公室。“我当时只是处于一种恐慌模式,正在开设实验室、订购冰柜、试图安装设备和招聘人员,”埃尔德解释说。“黛安肯定不得不回来,说,‘拜托,醒醒。注意一下。’”
他们在松鼠猴中检测到多个拷贝的基因称为带电多泡体蛋白 3,或 CHMP3。每只松鼠猴似乎都有该基因的三个变体。相比之下,人类只有 CHMP3 的一个原始变体。人们认为,由于可转座元件,该基因以多个版本存在于松鼠猴基因组中。大约在 3500 万年前的某个时候,在松鼠猴的祖先中,LINE-1 逆转座子被认为从细胞核内的基因组中跳出,并进入细胞的细胞质。在与细胞质中的 CHMP3 RNA 结合后,可转座元件将 CHMP3 的代码带回细胞核,并将其重新整合到基因组中。当 CHMP3 的额外版本被复制到基因组中时,它们没有被细胞机制完美地复制,因此序列中引入了变化。初看数据,这些缺陷似乎使它们成为无功能的“假基因”。但随着埃尔德的团队深入研究松鼠猴为何有如此多 CHMP3 拷贝的谜团,一个有趣的故事浮出水面。

隐藏在眼皮底下:松鼠猴携带 CHMP3 基因的额外拷贝。图片来源:Ariadne Van Zandbergen Alamy
假基因的发现并非完全罕见。人类基因组中有超过 500,000 个 LINE-1 逆转座子11,这些元件也清除了细胞内其他蛋白质的代码并重新插入。与基因组中的内源性逆转录病毒元件不同,后者可以清楚地追溯到古老的病毒,LINE-1 逆转座子的起源是模糊的。然而,这两种类型的可转座元件都包含一种称为逆转录酶的酶的代码,理论上,这使得它们能够将遗传代码重新插入细胞核中的基因组。这种酶正是使 LINE-1 活动能够将 CHMP3 复制回松鼠猴祖先基因组的原因。
埃尔德无法停止思考松鼠猴为何拥有多个 CHMP3 变体的谜团。他知道,在人类中,CHMP3 基因的功能变体产生一种蛋白质,HIV 利用该蛋白质从细胞膜上出芽,并传播到身体的其他细胞并感染它们。十年前,一个科学家团队使用一种工程改造的载体,促使培养皿中的人类细胞产生 CHMP3 蛋白的截短的、失活的版本,并表明这种截短的蛋白质阻止了 HIV 从细胞中出芽12。人们希望这一见解将产生一种治疗 HIV 感染并因此预防 AIDS 的新方法。不幸的是,这种蛋白质还在允许其他重要的分子信号促进从细胞膜上出芽的包囊形成方面发挥作用。因此,科学家诱导细胞产生的破损的 CHMP3 蛋白很快导致细胞死亡。
鉴于 HIV 等病毒使用依赖于正常 CHMP3 蛋白的出芽途径,埃尔德想知道松鼠猴携带的额外、改变的 CHMP3 拷贝是否在细胞水平上赋予了某种针对病毒的保护作用。他与全球各地的研究人员协调,他们从德克萨斯州巴斯特罗普到法属圭亚那等遥远的灵长类动物中心寄来了松鼠猴的血液。当埃尔德的团队分析血液时,他们发现松鼠猴实际上产生了它们携带的 CHMP3 的一种改变版本。这一发现表明,在该物种中,CHMP3 拷贝之一是功能性假基因,使其更恰当地被称为“逆转基因”。在进一步的实验中,埃尔德的研究小组使用了一种遗传工具,诱导培养皿中的人类肾细胞产生这种逆转基因版本的 CHMP3。然后,他们允许 HIV 进入细胞,发现病毒显著降低了离开细胞的能力,从而阻止了病毒的蔓延。相比之下,在未经过基因工程改造以产生逆转基因的细胞中,HIV 能够离开细胞,这意味着它理论上可以感染更多细胞。
在实验的另一部分中,埃尔德的研究小组证明,虽然经过调整以产生有毒的、截短的 CHMP3 版本的(十年前最初经过工程改造的那种)人类细胞会死亡,但诱导产生松鼠猴逆转基因版本的 CHMP3 的细胞可以存活。通过与截短版本的进一步比较,埃尔德发现,这些小型灵长类动物中的逆转基因(他称之为 retroCHMP3)不知何故获得了突变,导致 CHMP3 蛋白包含 20 个氨基酸变化。他认为,逆转基因产生的蛋白质中这 20 个差异点的某种组合使其对细胞本身无毒,但仍然能够破坏 HIV 从细胞中出芽的努力。埃尔德于 2 月在新墨西哥州举行的病毒免疫基石研讨会上介绍了这些计划发表的发现。
弗雷德·哈钦森癌症研究中心的病毒学家迈克尔·埃默曼说,来自松鼠猴的 retroCHMP3 可能抑制 HIV 等病毒传播的想法很有趣。“拥有一个过程的抑制剂总是有助于你理解什么对它很重要,”埃默曼解释说。他补充说,retroCHMP3 对细胞无毒也值得注意,因为这一发现可能会启发一种新的抗病毒药物:“它可能有助于你设计小分子或药物,这些小分子或药物可以特异性地抑制病毒使用的途径部分,而不是宿主细胞使用的途径部分。”
康涅狄格州纽黑文耶鲁大学医学院的免疫学家秋子·岩崎也乐观地认为,这一发现将取得进展。“这种 HIV 限制机制如此酷的地方在于,HIV 不直接与 retroCHMP3 结合,这使得病毒更难克服 retroCHMP3 施加的阻碍,”岩崎说。“即使人类没有 retroCHMP3 基因,通过了解 retroCHMP3 在其他灵长类动物中如何工作,人们也可以设计策略来模拟人类细胞中 retroCHMP3 的活性,以阻止 HIV 复制。”
埃尔德希望,如果这些发现成立,有一天可以提取 HIV 感染患者的细胞,并对其进行编辑以包含 retroCHMP3 的拷贝,然后再重新引入这些患者体内。科学家们已经在临床试验中使用了类似的细胞编辑方法,使细胞配备另一种名为 CCR5 的基因的变体,该变体可阻止 HIV 进入细胞。在这些实验中,患者接受了自体细胞的输注——这些细胞经过修饰以携带罕见的 CCR5 变体。但是,尽管初步结果表明该方法是安全的,但尚未有足够的证据证明其有效性。(另一个令人担忧的点是,携带罕见的、修饰版本的 CCR5 基因的人感染西尼罗病毒的风险可能比携带该基因正常版本的人高出 13 倍13。)埃尔德建议,通过同时编辑 retroCHMP3 和阻止 HIV 进入细胞的 CCR5 版本,这种基因编辑的组合可以提供一种更强大的方法来修饰患者细胞以治疗 HIV 感染。
“你可以想象进行一种鸡尾酒基因疗法,以便以病毒无法适应的方式阻止 HIV,”埃尔德说。他的团队还计划测试 retroCHMP3 是否对其他病毒(包括埃博拉病毒)具有抗病毒活性。

回归复古:经过基因工程改造以产生 retroCHMP3 的人类细胞(绿色显示)。图片来源:Diane Downhour
关于假基因和逆转基因如何影响健康的研究正在进行中。越来越多的证据表明,产生它们的 LINE-1 元件比以前认为的更活跃。例如,在 2015 年,加利福尼亚州索尔克研究所的科学家报告了一个以前未识别的 LINE-1 逆转座子区域,该区域在某种程度上是超强的。研究人员确定的区域编码一种蛋白质,该蛋白质最终帮助逆转座子拾取细胞质中的 DNA 片段,以将其重新插入基因组14。同一区域还增强了 LINE-1 元件在基因组中跳跃的能力,从而产生变异,这增加了这样一种观点的分量,即可转座元件可能在人类进化和在不同人群之间创造多样性方面发挥着被低估的作用。
美国国家癌症研究所弗雷德里克分所和波士顿塔夫茨大学的逆转录病毒研究员约翰·科芬表示,可转座元件的活跃功能比许多人意识到的更重要。“它们能够——并且已经——以重要的方式为我们的生物学做出贡献,”他说。“我认为它们在塑造我们进化历史中的作用被许多进化生物学家低估了。”
移动中
松鼠猴并非唯一可能因可转座元件引起的基因组变化而获得针对病毒入侵者保护的动物。2014 年,日本科学家报告了一块嵌入十三条纹地松鼠(Ictidomys tridecemlineatus)基因组中的博尔纳病毒。该团队从细胞实验中获得的结果表明,这块转座片段编码一种蛋白质,该蛋白质可能会干扰试图入侵这些动物的外部博尔纳病毒的致病性15。人类基因组中也嵌入了博尔纳病毒片段。但我们没有地松鼠拥有的相同抗病毒版本——因此我们可能对入侵的博尔纳病毒的保护较少。
其他对内源性病毒的研究可能对人类健康有更明确的意义,因此科学家们正在研究这些可转座元件在各种其他动物(包括家猫)中的活性。去年 10 月,另一组日本研究人员发现,嵌入家猫基因组中的病毒具有一定的复制能力。这种复制取决于猫科动物细胞通过一种称为甲基化的沉默过程抑制基因组中内源性病毒的能力16。但也许最引人注目的复制性内源性逆转录病毒的例子是在考拉身上。20 世纪 90 年代,澳大利亚昆士兰州梦幻世界主题公园的兽医注意到,考拉患淋巴瘤和其他癌症的比率惊人地高。罪魁祸首原来是一种在动物基因组中跳跃并造成严重破坏的逆转录病毒。值得注意的是,该国南部的考拉没有表现出逆转录病毒的迹象,这表明该病毒只是最近才开始整合到这些动物的 DNA 中17。
当我们接受来自其他物种(例如猪)的组织移植时,可转座元件对人类健康的风险是一个令人担忧的问题,猪具有猪内源性逆转录病毒。这些嵌入的病毒(不幸的缩写是 PERV)可以复制并感染人类细胞。
例如,来自猪的移植通常包括肌腱等组织,这些组织用于 ACL 损伤修复。但是这些组织被剥离了猪细胞——以及因此剥离了 PERV——因此只剩下组织支架。然而,学术机构和公司正在积极设计在人类中使用猪组织的新方法。今年早些时候,培根、热狗和香肠制造商史密斯菲尔德食品公司宣布,它已启动一个新的生物科学部门,以帮助未来向医疗公司供应猪零件。与此同时,哈佛医学院遗传学家兼企业家乔治·丘奇成立了一家名为 eGenesis Bio 的公司,以开发用于组织移植的人源化猪。3 月,该公司宣布已筹集 3800 万美元的风险投资。丘奇在两年前发表的一篇论文中表明,他的团队已从猪胚胎中编辑掉了 62 个 PERV 的关键片段,从而破坏了 PERV 的复制过程,并将其感染人类细胞的能力降低了 1000 倍18。
虽然丘奇和其他科学家试图破坏动物基因组中的内源性逆转录病毒,但研究人员也尝试复活它们:十年前,一群法国遗传学家通过纠正数千年来使其在基因组中沉默的突变,重新创造了一种人类内源性逆转录病毒,引发了一些争议。科学家们称之为“凤凰”病毒,但它在实验室中仅显示出微弱的感染人类细胞的能力19。毫不奇怪,人们对复活我们基因组中嵌入的病毒的想法表示反对——无论由此产生的病毒创造物多么虚弱。
但新兴的数据表明,埋藏在人类基因组中的逆转录病毒可能并不像我们想象的那么休眠。加拿大温尼伯大学的病毒学家蕾妮·杜维尔表示,这些内源性逆转录病毒从基因组中“觉醒的能力比以前认为的更为普遍”。她认为这种现象是细胞内的规律,而不是例外:“这些逆转录元件是从基因组中产生的,作为细胞正常功能的一部分,程度各不相同。”

近距离观察:内尔斯·埃尔德和黛安·唐豪尔在实验室中搜索遗传数据。图片来源:Julie Kiefer 犹他大学健康
有趣的是,参与控制癌症的细胞机制也可能与可转座元件有关。在人类基因组中,重要的肿瘤抑制蛋白 p53 的三分之一结合位点位于我们 DNA 中的内源性逆转录病毒内20。去年,由德克萨斯大学西南医学中心达拉斯分校的约翰·艾布拉姆斯领导的一个研究小组提供了初步证据,表明 p53 可能通过控制嵌入的逆转录元件来发挥作用21。
艾布拉姆斯回忆说:“当我第一次公开谈论这个故事时,我的一些癌症界同事说,‘嘿,这很可爱,但它不可能是真的。它不可能成真的原因是,我们早就知道了。’” 他解释说,以前没有看到它的原因是,许多遗传分析都丢弃了重复序列——重复序列通常由逆转录元件组成。因此,他的团队不得不“翻垃圾箱”,在遗传数据库中寻找这些感兴趣的序列,以证明与 p53 的联系。艾布拉姆斯怀疑,当 p53 未能控制住逆转座子时,肿瘤可能会以某种方式出现:“下一个问题就变成了,‘你是如何患上癌症的?’” 艾布拉姆斯说,这是一个他称之为“转座子病”的例子。
并非所有科学家都确信 p53 与癌症中的逆转录元件之间存在因果联系。“我的问题是,如果 p53 在抑制癌症中的逆转座子活性方面如此重要,为什么我们没有发现证据表明失调的逆转座子更频繁地将自身的拷贝插入肿瘤基因组?” 加州大学圣克鲁兹分校的基因组学专家戴维·豪斯勒问道。“大多数肿瘤都有 p53 突变,但只有极小比例的肿瘤显示出新逆转座子拷贝插入速率显著失调的证据。”
尽管如此,还有其他人有兴趣探索古老病毒是否会在癌症中重新觉醒,或者在这种疾病中发挥其他作用。五年前,德克萨斯大学 MD 安德森癌症中心的科学家报告说,人类内源性逆转录病毒 K 型 (HERV-K) 产生的一种病毒蛋白经常在乳腺癌细胞表面发现。在一项小鼠实验中,他们表明,用针对该蛋白的抗体治疗的癌症仅生长到未接受这种疗法的肿瘤的三分之一大小22。
但一些癌症科学家正在考虑利用内源性逆转录病毒来对抗癌症。纽约市洛克菲勒大学的保罗·比尼亚什通过研究人类内源性逆转录病毒 T 型 (HERV-T) 获得了对这种方法的深入了解——HERV-T 是一种古老病毒,在我们的灵长类动物祖先中传播了 2500 万年,直到大约 1100 万年前灭绝,并在某个时候化石化在我们的 DNA 谱系中。今年 4 月,他的研究小组发现,一种特定的 HERV-T 编码一种蛋白质,该蛋白质阻断了一种名为单羧酸转运蛋白 1 的蛋白质,该蛋白质在某些类型的癌细胞表面大量存在23。据认为,单羧酸转运蛋白 1 在促进肿瘤生长方面发挥作用。比尼亚什推测,阻断它可以帮助阻止恶性肿瘤的扩张。他和他的同事现在正试图构建一种“溶瘤病毒”,该病毒利用 HERV-T 的元素来治疗癌症。
新病毒可能仍在试图悄悄潜入我们的基因组的想法令人恐惧,即使它们似乎并没有非常有效地实现这一点。最近整合到我们基因组中并以代代相传的方式传播的病毒之一是人类内源性逆转录病毒 K113 型 (HERV-K133),它位于 19 号染色体上。它仅在全世界约三分之一的人口中发现,其中大多数人具有非洲、亚洲或波利尼西亚血统。研究人员表示,它可能在最近 20 万年前整合到基因组中6。
尽管专家们仍然怀疑病毒是否会在短期内再次整合到人类基因组中,但其他转座因子,如LINE-1s,仍在我们的DNA中移动。与此同时,芭芭拉·麦克林托克半个多世纪前播下的种子领域正在快速发展。约翰·艾布拉姆斯正在研究逆转录转座子,他说我们才刚刚开始理解基因组的动态性。他指出,人们只是在最近才开始意识到生活在我们肠道中的细菌“微生物群”如何影响我们的健康。“我们实际上是一个生态系统,”艾布拉姆斯在谈到肠道时说,“基因组也是如此。”他解释说,这里有宿主DNA——属于我们——以及它包含的逆转录转座子,“两者之间存在着某种富有成效的张力。”
本文经许可转载,最初于 首次发表 于2017年7月11日。