来自《量子杂志》(在此处查找原始故事)。
大约40亿年前,分子开始自我复制,这一事件标志着地球生命的开始。几亿年后,原始生物开始分裂成构成生命之树的不同分支。在这两个开创性事件之间,出现了一些最伟大的创新:细胞、遗传密码以及为这一切提供动力的能量系统。这三者对于我们所知的生命至关重要,但科学家们对这些非凡的生物创新是如何产生的知之甚少,令人失望。
“甚至在最后一个共同祖先之前,也很难推断进化事件的相对顺序,”麻省理工学院的地质生物学家格雷格·富尼耶说。细胞可能出现在能量代谢之前,或者反之亦然。由于没有从这一时期生活的生物中保存下来的化石或DNA,科学家们几乎没有数据可供研究。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保有关塑造我们今天世界的发现和想法的具有影响力的故事的未来。
富尼耶正在领导一项尝试,以重建生命在那些进化黑暗时代的历史——从生命首次出现到分裂成最终成为无穷无尽的存在纠结的数亿年。
他正在使用来自活生物体的基因组数据来推断古代基因的DNA序列,作为被称为古基因组学的新兴领域的一部分。在3月份在《分子进化杂志》上在线发表的研究中,富尼耶表明添加到代码中的最后一个化学字母是一个名为色氨酸的分子——一种因存在于火鸡晚餐中而闻名的氨基酸。这项工作支持了遗传密码逐渐进化的观点。
使用类似的方法,他希望破译更多密码的时间顺序——确定每个字母何时添加到遗传字母表中——并确定生命起源中的关键事件,例如细胞的出现。
黑暗的起源
生命出现的时间太久远了,以至于当时覆盖地球的岩层都被摧毁了——随之而来的,还有早期进化的化学和地质线索。“在生命起源和最后的共同祖先之间存在着巨大的鸿沟,”亚特兰大佐治亚理工学院的生物学家埃里克·高切说。
科学家们确实知道,在那段时间的某个时刻,生物开始使用遗传密码,这是制造复杂蛋白质的蓝图。正是这些蛋白质执行细胞的重要功能。(DNA和RNA的结构还使得遗传信息能够被复制并代代相传,但这与蛋白质的产生是不同的过程。)代码的组成部分和组装它们的分子机制“是细胞中最古老和最普遍的方面,生物学家们对理解它们进化的机制非常感兴趣,”安大略省汉密尔顿麦克马斯特大学的生物物理学家保罗·希格斯说。
代码是如何产生的提出了一个先有鸡还是先有蛋的问题。代码中的关键参与者——DNA、RNA、氨基酸和蛋白质——是化学上复杂的结构,它们协同工作以制造蛋白质。但在现代细胞中,蛋白质被用来制造代码的组成部分。那么,一个高度结构化的代码是如何出现的呢?
大多数研究人员认为,该代码最初是从由有限的氨基酸字母表制成的基本蛋白质开始的。随着时间的推移,随着这些蛋白质学会制造更复杂的分子,其复杂性逐渐增加。最终,它发展成为一种能够创造我们今天所看到的所有多样性的代码。“长期以来,人们一直假设生命由20种氨基酸组成的‘标准字母表’是从一种更简单、更早的字母表进化而来的,就像英文字母在其历史中积累了额外的字母一样,”马里兰大学巴尔的摩县分校的生物学家斯蒂芬·弗里兰说。
代码中最早的氨基酸字母很可能是结构最简单的,那些可以通过纯粹的化学手段制成的,而无需蛋白质辅助。(例如,在陨石上发现了氨基酸甘氨酸、丙氨酸和谷氨酸,表明它们可以在各种环境中自发形成。)它们就像字母A、E和S——作为后来基础的原始单元。
相比之下,色氨酸具有复杂的结构,并且在蛋白质代码中相对罕见,就像Y或Z一样,这导致科学家们推测它是代码中最新添加的字母之一。
化学证据令人信服,但却是间接的。富尼耶来了。他怀疑,通过扩展他在古基因组学方面的工作,他将能够证明色氨酸是添加到代码中的最后一个字母。
最后一个字母
科学家们重建古代蛋白质已经十多年了,主要是为了弄清楚古代蛋白质与现代蛋白质有何不同——它们的样子以及它们的功能。但这些努力主要集中在最后一个普遍共同祖先(或研究人员称之为LUCA)之后的进化时期。富尼耶的工作比以往任何努力都更深入地追溯了过去。为此,他必须超越比较基因组学的标准应用,后者分析生命之树上分支之间的差异。“根据定义,任何先于LUCA的东西都位于树中最深的分裂之外,”他说。
富尼耶从两种相关的蛋白质TrpRS(色氨酰tRNA合成酶)和TyrRS(酪氨酰tRNA合成酶)开始,它们帮助将RNA字母解码为氨基酸色氨酸和酪氨酸。TrpRS和TyrRS彼此之间的关系比与其他任何蛋白质都更密切,这表明它们是从同一个祖先蛋白质进化而来的。在LUCA之前的某个时候,该亲代蛋白质略有突变,产生了这两种具有不同功能的新蛋白质。富尼耶使用计算技术来破译该祖先蛋白质的模样。
他发现祖先蛋白质具有所有氨基酸,但色氨酸除外,这表明它的添加是遗传密码的最后润色。“它令人信服地表明,色氨酸是最后添加的氨基酸,正如以前推测的那样,但没有像这里所做的那样真正确定,”伊利诺伊大学厄巴纳-香槟分校的物理学家奈杰尔·戈尔登菲尔德说,他没有参与这项研究。
富尼耶现在计划使用色氨酸作为标记来确定其他主要的LUCA前事件的日期,例如代谢、细胞和细胞分裂的进化,以及遗传机制。这三个过程形成了一种生物三头政治,为我们今天所知的生命奠定了基础。但我们对它们是如何产生的知之甚少。“如果我们理解这些基本步骤的顺序,它会创建一个指向生命起源可能情景的箭头,”富尼耶说。
例如,如果参与代谢的祖先蛋白质缺乏色氨酸,那么某种形式的代谢可能很早就进化了。如果指导细胞分裂的蛋白质布满了色氨酸,则表明这些蛋白质的进化相对较晚。
不同的生命起源模型对这三个过程中的哪一个先出现做出了不同的预测。富尼耶希望他的方法能够提供一种排除其中一些模型的方法。但是,他警告说,它不会明确地确定这些事件的时间。
富尼耶计划使用相同的技术来弄清楚其他氨基酸添加到代码中的顺序。“它真正加强了代码本身的演化是一个渐进过程的观点,”斯克里普斯研究所的分子和细胞生物学教授保罗·席默说,他没有参与这项研究。“它说明了大自然用来完善这些蛋白质的精细性和微妙性,以及它形成这棵巨大的生命之树所需的多样性。”
经《量子杂志》许可转载,《量子杂志》是西蒙斯基金会的一个编辑上独立的部门,其使命是通过报道数学、物理和生命科学的研究进展和趋势,来增进公众对科学的理解。