不起眼的 DNA 变化如何危害健康

曾经被认为无关紧要而被忽视的 DNA 微小变化,正在被证明对人类疾病、进化和生物技术至关重要

长期以来,生物学家们认为他们了解基因突变如何导致疾病。但最近的研究揭示了故事中一个重要的转折,并揭示了 DNA 改变使人生病的令人惊讶甚至违反直觉的方式。传统的观点认为,所谓的“沉默”突变对健康无关紧要,因为 DNA 中的这种变化不会改变基因编码的蛋白质的组成。蛋白质在细胞执行的几乎所有过程中都发挥作用,从催化生化反应到识别外来入侵者。因此,人们认为,如果蛋白质的构成最终是正确的,那么导致其构建过程中的任何小故障都不会对身体造成伤害。

然而,侦探工作偶尔会将一种疾病追溯到沉默突变,即使研究人员认为这不可能是罪魁祸首。基因组进化研究中也出现了类似的谜团,各种物种 DNA 变化模式表明,许多沉默突变被长期保存下来,这表明它们对拥有它们的生物体是有用的。在许多物种中,这些变化似乎有助于细胞更有效地制造蛋白质,但在人类中则不然。

现在,研究人员开始梳理沉默突变可能对人类健康和疾病产生的影响。研究结果表明,为改进基因疗法和基因工程的设计提供了有趣的新途径。


支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来能够持续报道关于塑造我们今天世界的发现和思想的具有影响力的故事。


同义但不同
当人们观察细胞制造蛋白质的方式时,基因突变如何不影响蛋白质就变得清晰了。基本公式很简单:DNA 核苷酸链产生几乎相同的 RNA 核苷酸序列,然后 RNA 核苷酸序列被翻译成氨基酸链,氨基酸链整齐地折叠成蛋白质。这种核酸字母表的字母通过它们的化学碱基来区分——DNA 中的腺嘌呤 (A)、胞嘧啶 (C)、鸟嘌呤 (G) 和胸腺嘧啶 (T),RNA 中用尿嘧啶 (U) 代替胸腺嘧啶。

换句话说,编码在核酸中的指令必须转换成氨基酸的语言,以便它们的“意义”(有用的蛋白质)能够被表达。当基因被“表达”时,DNA 双螺旋的两条链分离,细胞机制将沿着单链的核苷酸序列转录成 RNA 的副本。然后,这种信使 RNA (mRNA) 转录本通常必须被编辑成更简短的形式,然后才能被核糖体和称为转移 RNA (tRNA) 的较小 RNA 翻译成蛋白质。当核糖体沿着 mRNA 移动时,tRNA 到达以递送编码的氨基酸。每个 tRNA 携带一个特定的氨基酸,并且大多数 tRNA 能够识别 mRNA 链中仅一个特定的三核苷酸序列。当 tRNA 遇到其 mRNA 匹配项时,核糖体将 tRNA 的氨基酸货物添加到正在增长的氨基酸链中。

细胞用来将 DNA 和 RNA 语言翻译成蛋白质的代码——著名的遗传密码——因此仅仅是控制哪个 tRNA 携带哪个氨基酸的规则集。这个代码有一个关键特征:它是冗余的。所有基因及其 mRNA 都被组织成三个字母的“单词”,称为密码子。可以从四核苷酸字母表中构建六十四个三字母密码子。三个密码子充当停止信号以停止 RNA 翻译,这仍然留下 61 个可能的密码子来指定仅 20 个氨基酸的蛋白质字母表,因此几乎每个氨基酸都由多个密码子指定。例如,所有以 GG 开头的密码子(GGA、GGC、GGG、GGU)都被翻译成氨基酸甘氨酸,使这些密码子成为同义词。

DNA 的单字母变化,称为点突变,因此可以将密码子更改为指定错误氨基酸的密码子(称为错义突变)或停止信号(无义突变),导致最终蛋白质被截短。单碱基变化也可能改变停止密码子,使其编码氨基酸(有义突变),从而导致蛋白质延长。最后一种变化是可能的:改变核苷酸但产生同义密码子的突变。这些突变被称为“沉默”突变。

偏倚的证据
当然,有很多例子表明前三种点突变对人类健康有重大影响。例如,编码构成红细胞中血红蛋白分子的蛋白质的基因中的三种不同的点突变是导致三种不同严重疾病的原因。在镰状细胞性贫血的情况下,错义突变将亲水性氨基酸替换为疏水性氨基酸,导致蛋白质聚集在一起并产生特征性的镰刀状血细胞。在红细胞增多症疾病中,无义突变会截短一种血红蛋白蛋白质,导致血液增稠。在地中海贫血中,有义突变将停止密码子 (TAA) 更改为谷氨酰胺的密码子 (CAA),从而产生更长且无功能的蛋白质。

直到 20 世纪 80 年代,科学家才意识到沉默突变也可能影响蛋白质的产生——至少在细菌和酵母中是这样。当时的一个关键发现是,这些生物体的基因没有平等地使用同义密码子。例如,当大肠杆菌指定氨基酸天冬酰胺时,其 DNA 中出现的密码子 AAC 比 AAT 频繁得多。很快就清楚了这种有偏倚的密码子使用的原因:细胞优先使用某些密码子,因为这些选择提高了蛋白质合成的速度或准确性。

事实证明,与这些同义密码子相对应的 tRNA 通常在细胞内并非同样丰富。因此,最重要的是,含有更多与相对丰富的 tRNA 匹配的密码子的基因将被翻译得更快,因为这些 tRNA 的较高浓度将使它们在需要时更有可能存在。在其他情况下,单一 tRNA 变体与多个同义密码子匹配,但更容易与特定密码子结合,因此使用该密码子可以最大限度地提高翻译的准确性。因此,细胞有充分的理由不平等地使用所有密码子。正如预期的那样,在细菌和酵母中,编码特别丰富的蛋白质的基因表现出最大的密码子偏倚,首选密码子与最常见或结合力更好的 tRNA 相匹配。

后来在其他生物体(包括植物、果蝇和蠕虫)中的观察揭示了类似的偏倚。如此多样的物种采用这种技术来提高蛋白质生产的效率,哺乳动物似乎也很可能也会这样做。对哺乳动物基因的分析确实揭示了偏爱某些密码子的趋势。然而,简单生物体和哺乳动物之间的相似之处被证明只是表面现象。由于原因尚不完全清楚,哺乳动物基因组被组织成大的块,每个块都具有独特的倾斜核苷酸含量:一些区域富含 G 和 C 碱基,而另一些区域富含 A 和 T。因此,位于基因组 GC 富集区域的基因往往具有许多含有这些碱基的密码子。因此,我们的基因确实显示出使用某些密码子的偏倚,但与更简单的生物体不同,哺乳动物的模式并没有明显表明原因是优化蛋白质合成。

多年来,这些发现似乎降低了沉默突变影响人体功能的可能性。然而,从 21 世纪初开始,不同物种中相同基因的比较开始暗示,这种正统观念是错误的。人们可以通过比较两个物种中基因序列发生变异的位点和保持不变的位点来衡量两个物种中基因序列发生变异的速率。原则上,任何不影响生物体的突变对自然选择的力量是不可见的,自然选择保留有益的变异。根据当时的思路,对选择不可见的区域将包括基因内沉默突变的位点以及不指定蛋白质的基因组的 98%——非编码 DNA。然而,当科学家开始研究基因中沉默位点的进化速度是否与非编码区域相同,他们意外地发现了差异——这表明沉默突变毕竟可能影响生理机能。

打破沉默
最初,研究人员不知道这种突变如何在哺乳动物中干扰蛋白质的制造。然而,最近,对人类疾病的研究不仅提供了一种机制,而且提供了多种机制。致病性沉默突变会干扰蛋白质制造过程的几个阶段,从 DNA 转录一直到 mRNA 翻译成蛋白质。

一个例子是沉默突变改变基因转录本的编辑方式。在基因转录成 RNA 形式后不久,该转录本会被修剪以去除称为内含子的非编码区域。就像电影剪辑师剪掉不需要的胶片一样,细胞剪接机制需要找到编码氨基酸的良好片段,称为外显子,然后将它们剪接在一起以产生基因的最终 mRNA 版本。人类基因尤其富含内含子,每个基因平均有八个长的内含子片段,因此剪接机制需要一种方法来识别每个外显子的起点和终点。

过去几年的研究表明,外显子不仅指定氨基酸,它们还在其序列中包含内含子去除所需的线索。其中最主要的是外显子剪接增强子 (ESE) 基序——大约三到八个核苷酸的短序列,位于外显子的末端附近,并为细胞剪接机制定义外显子。对这种基序的需求实际上可以解释人类基因中对某些核苷酸的偏好。虽然编码甘氨酸的密码子 GGA 和 GGG 都可能出现在剪接增强子中,但前者密码子充当更有效的增强子,从而导致更有效的剪接。GGA 在外显子末端附近也相应地更常见。

为了支持在外显子剪接增强子中保留密码子序列的观点,我们与我们在巴斯大学的前同事 Joanna L. Parmley 所做的研究表明,显然充当剪接增强子的外显子基序在其同义密码子中的进化速度比不参与剪接的相邻序列慢。这种缓慢的进化表明,自然选择使增强子基序保持相对不变,因为它们的特定序列非常重要。包含这些增强子的密码子的沉默改变,即使它们不改变氨基酸,也可能对蛋白质产生重大影响,仅仅是因为它们破坏了内含子的正确去除。

事实上,当现在在布朗大学的 William Fairbrother 和他在麻省理工学院 Christopher Burge 实验室的同事比较外显子的末端时,他们发现人们彼此相当相似。这些与剪接相关的区域缺乏很多变异,即使在突变会沉默的位点也是如此。原因不是突变没有发生在我们外显子的末端,而是当它们出现时,这些突变对蛋白质生产的破坏性太大,以至于它们往往具有破坏性并从人群中消失。

迄今为止,大约 50 种遗传疾病已与沉默突变有关,其中许多突变似乎也干扰了内含子的去除。剪接增强子可以与基因蛋白质编码序列的相当长度重叠,从而对沉默突变的可容忍位置施加重大限制。国际遗传工程和生物技术中心 (的 Francisco Baralle) 最近记录了一个剪接增强子突变可能造成的损害的惊人例子。研究人员发现,他们在囊性纤维化跨膜电导调节器 (CFTR) 基因的一个外显子中诱导的 25% 的沉默突变破坏了剪接,因此可能导致囊性纤维化或相关疾病。

这并不是说剪接中断是沉默突变导致疾病的唯一机制。即使内含子从 RNA 转录本中正确去除,mRNA 也可能无法正确折叠。与教科书中(为简单起见)有时描述的不同,mRNA 不仅仅是一个无结构的线性字符串。就像在两条 DNA 链之间形成的核苷酸对一样,mRNA 的分离区域可以是互补的,并且会配对以创建称为茎环的复杂折叠结构。mRNA 折叠的方式决定了它的稳定性,而稳定性反过来会影响核糖体翻译它的速度以及细胞垃圾处理随后对其的降解。

多巴胺受体 D2 基因中,该基因编码检测神经递质多巴胺存在的细胞表面受体,一种沉默突变导致 mRNA 比正常情况下更快地降解。结果,产生的编码蛋白减少,导致认知障碍。相反,在儿茶酚-O-甲基转移酶 (COMT) 基因中,沉默突变增加了 mRNA 折叠的程度,可能产生过多的结构,在翻译前可能难以解开——降低蛋白质合成。北卡罗来纳大学教堂山分校的 Andrea G. Nackley 和她的同事发现,这种突变会影响疼痛耐受性;这项研究是在牙科学校完成的,也许这并不奇怪。

沉默突变影响蛋白质的另一个例子也是最直接的影响之一,它涉及一种称为多药耐药性 1 的基因。该基因之所以如此命名,是因为其蛋白质产物是一种细胞泵,在癌细胞中帮助排出化疗药物,从而赋予这些细胞耐药性。国家癌症研究所的 Chava Kimchi-Sarfaty 和她的同事发现,沉默变化导致泵蛋白错误折叠,降低了细胞排出药物的能力。由于翻译过程和蛋白质折叠可以同时发生,研究人员推测,沉默突变产生的较稀有的同义密码子导致翻译过程中出现停顿,这反过来又使蛋白质有时间采用不寻常的结构。如果发生这种停顿,确切原因尚不清楚,可以将其添加到关于基因和蛋白质工作原理的尚未解决的谜团列表中。

高效基因,有效药物
科学家可以从最近关于沉默突变影响的发现中汲取的一个教训是,在我们的假设中要谨慎。当没有机制将沉默变化与蛋白质生产的改变联系起来时,对同义突变一定是“沉默”的信心很普遍。但鉴于上述引人注目的例子,这种立场不再站得住脚。

认识到并非沉默的突变的力量开始帮助研究人员改进基因工程方法。了解基因中哪些核苷酸需要保留,哪些核苷酸可能被替换,这在生物技术中具有直接应用。基因疗法和使用动物或微生物工业化生产蛋白质(例如治疗药物)都依赖于设计和制造基因并将其插入细胞基因组的能力。创建有效工作的基因充满了困难,其中包括确保新引入的转基因被细胞激活,从而产生足够量的其编码蛋白质。这就是对同义但不沉默的突变的影响的敏感性发挥作用的地方。

在人类基因中,大多数内含子似乎是可有可无的(只有一个,通常是第一个内含子,似乎是基因产生蛋白质所必需的)。这一观察结果意味着可以通过去除内含子来使转基因紧凑。这也意味着一些沉默突变位点可以被调整而不会产生不利影响,因为省略内含子消除了对剪接增强子的需求。从这种约束中解放出来,遗传学家可以利用这些沉默位点用于其他目的。

华沙国际分子和细胞生物学研究所最近的一项实验说明了如何为了人类利益而操纵沉默突变位点。Grzegorz Kudla 和他的同事获取了三个基因,并且仅仅改变了沉默位点特定核苷酸碱基的相对比例,然后将改变后的基因转移到哺乳动物细胞中。令人惊讶的是,研究人员发现,与相同基因的 GC 含量低的变体相比,增加 G 和 C 含量导致基因活性和蛋白质制造效率提高了 100 倍。

新的理解还应该为理解疾病的根本原因提供信息。许多寻找疾病潜在基因的项目都以正在进行的基因组作图项目为中心,这些项目旨在编目人类之间的遗传变异。通过识别患有特定疾病的个体中的所有点突变或单核苷酸多态性 (SNP),科学家现在可以定位到基因组中包含可能导致该疾病的基因变异的区域。

直到最近,此类搜索都假设,如果基因中的多个突变与疾病的存在相关,那么那些改变蛋白质氨基酸序列的突变一定是致病变异。事实上,与疼痛耐受性相关的COMT 基因已知有一种突变,该突变将一个氨基酸改变为另一个氨基酸,并且长期以来一直认为该变异是疼痛不耐受的唯一原因。然而,疼痛耐受性非常高或非常低的个体在那个突变位点具有相同的核苷酸,这表明他们的差异必然有其他原因。只有在阐明了沉默突变可能产生影响的机制后,实验结果揭示 COMT 中的沉默突变是罪魁祸首才被接受。

某些疾病的原因很可能被错误地归因于改变蛋白质的突变,而实际上是同义突变在作祟。研究人员在基因组大海捞针中寻找有害突变针时,需要牢记这种可能性。谁知道此类调查还会发现哪些额外的疾病机制?

到目前为止的发现是否意味着沉默突变经常导致疾病?也许是这样。人们可能会认为沉默变化在智力上很有趣并且可能具有实际意义,但它们显然不是许多疾病的原因。然而,最近对基因如何进化的研究表明,这种观点可能过于自满。几年前,我们中的一位(Hurst)表明,在BRCA1 基因(与早发性乳腺癌相关)的一个片段中,啮齿动物和人类的沉默位点的进化速度都非常慢。相比之下,该基因片段中的其他序列以正常速度进化。这种差异并不意味着缓慢进化的沉默位点中的突变很少见,而是意味着携带这些突变的个体死亡而没有将它们遗传下去。后来,该片段被证明与剪接增强子的位置重合——换句话说,这是另一个例子,其中沉默突变是如此具有破坏性,以至于其携带者死亡。

自然选择施加压力以使沉默位点不发生变化的基因片段有多普遍?Hurst 和 Parmley 通过扫描基因来研究这个问题,寻找沉默位点的进化速率与改变氨基酸的位点的速率明显不同的区域。令我们惊讶的是,我们发现含有异常缓慢进化的沉默位点的 DNA 片段相对常见。事实上,它们比编码氨基酸进化异常迅速的区域更为普遍。一段非常高度保守的沉默突变位点平均每 10,000 到 15,000 个基因序列核苷酸出现一次。

我们估计,5% 到 10% 的人类基因包含至少一个沉默突变可能有害的区域。加州大学圣克鲁斯分校的 Peter Schattner 和 Mark Diekhans 进行了类似的分析,寻找基因中具有异常超保守沉默位点的大区域。他们估计,在他们检查的近 12,000 个基因中,大约有 1,600 个这样的区块,这与我们的估计大致相符。然而,这两个估计值都可能偏低,真实数字很可能要大得多。如果这些保守位点指示沉默突变可能导致疾病的位置,正如看起来很可能的那样,那么忽略它们将不可避免地导致疾病相关突变的错误识别。

认识到自然选择确实注意到并非沉默的突变与科学家们意识到基因制造蛋白质的过程比以前想象的要复杂得多和细致得多是齐头并进的。基因进化方式和它们的工作方式也以十年前几乎无法理解的程度紧密耦合。对这两个过程的进一步研究将继续阐明基因组工作原理的非凡复杂性。例如,DNA 不仅仅是一个线性分子,而是缠绕成线圈,必须解开才能进行转录。这个过程的控制是否也在沉默位点上留下指纹?同样,稀有密码子的运行比它们应该的更常见,但它们在做什么以及为什么?

这些和相关问题的答案不仅可以更好地理解蛋白质的制造,还可以为治愈疾病提供见解。

有偏倚的疫苗
操纵同义突变位点使科学家能够设计加速蛋白质制造的基因,但相同的技术也可用于减慢蛋白质制造。石溪大学的 Steffen Mueller 和他的同事最近采用了这种方法来设计一种更安全的脊髓灰质炎疫苗。活病毒是最好的疫苗,因为它们会在接受者中引起强烈的免疫反应,但活疫苗可以繁殖和突变,可能导致疾病。Mueller 的小组利用微生物偏爱使用某些密码子来最大限度地提高蛋白质生产效率的特性,设计了一种脊髓灰质炎病毒,该病毒在编码病毒外壳的序列中替换了较稀有、效率较低的密码子。由此产生的病毒能够复制自身,尽管速度较慢。在研究人员将工程病毒接种到小鼠体内后,当动物随后暴露于野生脊髓灰质炎病毒时,它们受到了感染保护。这种利用密码子偏倚来创建活的但减毒的疫苗的技术也可以应用于其他病原体,以生产有效但更安全的疫苗。

注意:本文最初印刷时的标题为“沉默突变的代价”。

© . All rights reserved.