这个问题涉及到许多生物 DNA 中遗传信息组织方式的一个奇特特征。构成 DNA 的碱基序列编码了相应的氨基酸序列,氨基酸序列构成了蛋白质。分子生物学家最初假设,在一个基因中,所有编码蛋白质的 DNA 都是连续的,当他们首次研究原核生物(细菌和其他简单细胞)的基因时,他们发现了这一点。然而,当研究人员观察更复杂的(真核)细胞时,他们发现编码 DNA 通常是不连续的:编码 DNA 的片段(称为外显子)与长段的非编码 DNA(称为内含子)交错排列。DNA 转录成 RNA 链后——但在 RNA 翻译成蛋白质之前——内含子会被剪切掉。虽然内含子有时被粗略地称为“垃圾 DNA”,但它们如此普遍并且在进化过程中被保留下来,这一事实让许多研究人员相信它们具有某种功能。
西弗吉尼亚大学生物系助理教授 Ashok Bidwai 详细阐述道
“人们普遍认为,内含子是遗传序列的残余,这些遗传序列曾经充当 DNA 片段之间的间隔,这些 DNA 片段编码特定的、相对简单的蛋白质。在复杂蛋白质的进化过程中,遗传密码的区域(称为结构域)可能被改组并组合在一起,产生新的序列,这些序列编码具有新功能的新的蛋白质结构。该假设基于以下观察:内含子在基因中的相对位置在生物体中基本保持不变,这些生物体包括果蝇(果蝇)、秀丽隐杆线虫(一种广泛研究的线虫)、小鼠和人类。哈佛大学的 Walter Gilbert 详细阐述了这一假设的许多细节。”
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
“此外,一些研究人员提出,内含子充当一种机制,选择在生物体发育早期(而不是晚期)表达的基因。然而,这个想法并非基于广泛的实验,因此其合理性尚不确定。”
在哈佛大学 Walter Gilbert 实验室工作的 Sandro J. de Souza 扩展了关于内含子的主流假设
“关于内含子功能的问题在 1977 年它们被发现后立即出现。内含子的作用是什么?它们为什么存在于我们的基因中?将近 20 年过去了,我们仍然没有明确的答案,即使一些 DNA 数据库现在包含大约 500 兆碱基的序列——也就是说,代表我们基因组中 5 亿个化学字母的遗传密码字符串。”
“首先,让我们从一些分类开始。至少有五种不同类型的内含子。其中一些是核酶,即具有催化活性的 RNA 分子,这意味着它们促进某些化学反应;其中一些核酶能够执行一种反应,在反应中它们将自身从原始转录本中剪切出来。最常见的内含子类型称为剪接体或核内含子;该名称来自细胞机制,称为剪接体,它负责剪接并确保内含子中的遗传序列不被翻译成垃圾蛋白质。这种类型的内含子是在人类核基因中发现的。”
“一般来说,核内含子广泛存在于复杂真核生物或高等生物中。简单的原核生物和真核生物(如真菌和原生动物)缺乏它们。在复杂的多细胞生物(如植物和脊椎动物)中,内含子比外显子(基因组的活性编码部分)长约 10 倍。内含子的序列和长度在进化过程中迅速变化。”
“内含子有时确实具有可识别的功能。科学家们已经发现了“功能性核内含子”的明确例子,这些内含子可以容纳对内含子所在基因的表达重要的序列。然而,这种功能并非内含子的一般特征,因为一些缺乏内含子的基因也能正常表达(例如组蛋白和嗅觉受体基因)。还有一些案例中,内含子包含小核 RNA 的基因,小核 RNA 对于信使 RNA 的翻译非常重要,信使 RNA 是 DNA 和蛋白质之间的中间体。核内含子在称为选择性剪接的过程中也很重要,选择性剪接可以从单个基因产生多种类型的信使 RNA。尽管这些例子证明了内含子的建设性作用,但它们无法解释为什么内含子在我们的基因中如此普遍。”
“1978 年,哈佛大学的 Walter Gilbert 对内含子的性质表达了不同的看法(在他创造“外显子”和“内含子”这两个术语的同一份报告中)。他认为,内含子可以通过促进外显子之间的遗传重组来加速进化。这个过程(他称之为“外显子改组”)将直接与新基因的形成相关。从这个角度来看,内含子具有深刻的目的。它们充当形成外显子新组合的重组热点。换句话说,它们存在于我们的基因中,是因为它们在进化过程中被用作组装新基因的更快途径。在过去的 10 年中,外显子改组的想法已得到来自各种实验方法的数据支持。”
“未来十年将完成多个基因组项目。预计它们将产生关于内含子序列的大量信息。新数据应该可以解决我们关于内含子功能的大部分基本问题。”