本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点。
最近关于 ENCODE 项目及其令人困惑的“80% 的 DNA 具有功能”的发现引起的轩然大波让我感到非常惊讶。尤其让我惊讶的是人们竟然会对垃圾 DNA 感到惊讶。不幸的是,这次科学家也难辞其咎,因为虽然围绕 ENCODE 的宣传是一场媒体灾难,但 80% 的说法源于科学论文本身。毫无疑问,该项目本身——代表着团队合作、坚持不懈的追求、技术精湛和一流科学的胜利——已经产生了极其有用的数据,并且毫无疑问它将继续这样做。 疑问在于公众损害需要多长时间才能修复。
关于科学家和记者对该项目发表的各种误导性言论,已经有很多文章进行了报道,我对此也无能为力。 我所能做的就是指出一些优秀的文章:Larry Moran 多年来在他的博客上长期致力于传播关于垃圾 DNA 的真正智慧。Ed Yong 详尽地总结了大量的观点、链接和分析。T. Ryan Gregory 发表了一些很棒的文章,驳斥了关于垃圾 DNA 神话的神话。而 John Timmer 对此事进行了最好的通俗解释。 科学家犯下的最大错误是如此宽松地定义“功能性”,以至于它可以意味着几乎所有的 DNA。 第二个大错误是没有向公众澄清功能性的含义。
但我感到惊讶的是,为什么人们如此难以接受大部分 DNA 实际上是垃圾。 即使对于像我这样不是专家的人来说,垃圾 DNA 的存在似乎也完全正常。 我认为,如果我们接受标准的进化论观点,垃圾 DNA 根本不应该让我们感到震惊。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。 通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造当今世界的发现和想法的具有影响力的故事。
标准的进化论观点告诉我们,进化是混乱的、不完整的和低效的。 DNA 由多种序列组成。 有些序列具有真正的生物学功能,因为它们被转录,然后翻译成具有明确生理作用的蛋白质。 然后还有一些序列只转录成 RNA,而 RNA 不起任何作用。 还有一些序列仅与 DNA 结合蛋白结合(这是 ENCODE 科学家认可的“功能性”的定义之一)。 最后,还有一些序列根本不起任何作用。 这些序列中的许多序列由 假基因 和 转座子 组成,并且是来自病毒和其他遗传漂浮物的有缺陷和功能失调的基因,通过我们漫长、不完美和混杂的遗传历史插入到我们的基因组中。 如果我们能够认识到进化是一个有缺陷的、零敲碎打的、低效的和拼凑的过程,我们就不应该对在我们的基因组中发现这种具有不同程度功能或没有功能的序列多样性感到惊讶。
大多数这些无用片段没有被清除的原因仅仅是因为没有必要。 我们应该记住,进化不是朝着最佳结果努力,它只能用它已经拥有的东西做到最好。 如果这些有缺陷和无功能的序列不是负担,那么去除它们的风险太大,工作量也太大; 简单地复制这些序列的工作量远小于去除它们的工作量。 因此,这些序列在我们漫长的进化历史中一直存在并被传递下来。 它们可能根本不发挥任何作用这一事实,与取决于机会的偶然自然机制以及仅仅作为额外负担将非功能性附加到有用功能上是完全一致的。
在我看来,还有两个事实应该让我们非常容易接受垃圾 DNA 的存在。 考虑一下,蝾螈的基因组是人类基因组的十倍大。 现在这意味着两种可能性; 要么蝾螈的功能性 DNA 是我们的十倍,要么我们和蝾螈之间的主要区别是它们有更多的垃圾 DNA。 如果蝾螈真的有那么多功能性 DNA,那么蝾螈的解剖学或生理学的复杂性难道不会大相径庭吗? 相反,与人类相比,蝾螈的相对简单性难道不会更符合仅仅是不同程度的垃圾 DNA 吗? 哪种解释听起来更合理?
接受垃圾 DNA 现实的第三个理由是简单地考虑突变负荷。 我们的基因组,与其他生物的基因组一样,在进化过程中经历了许多突变。 如果我们基因组的 90% 真的具有功能并且经历了突变,会产生什么后果? 在如此高的突变率下,我们如何生存和繁荣? 另一方面,如果我们假设我们基因组中发生的大多数突变都发生在垃圾 DNA 中,那么理解我们的生存就容易得多。
那么,总结一下,如果有人说他们对垃圾 DNA 感到惊讶,我们应该感到惊讶。 即使像我这样不是专家的人也能想到至少三个喜欢垃圾 DNA 的简单理由
1. 认识到进化本质上是一个混乱且低效的过程,经常产生垃圾。 如果这种垃圾没有引起麻烦,则可能会被保留。
2. 认识到基因组大小的巨大差异用垃圾 DNA 解释比假设大多数 DNA 真正具有功能性要好得多。
3. 认识到如果我们的大部分 DNA 不是垃圾 DNA,突变负荷将是令人望而却步的。
最后,作为一名化学家,我想说,我一点也不惊讶 DNA 结合蛋白与 DNA 的随机、非功能性片段结合。 这几乎不能使这些片段在生理上重要。 如果进化是混乱的,那么化学也同样混乱。 分子会粘附到许多其他分子上,并非所有这些相互作用都必须导致生理事件。 旨在与特定 DNA 序列结合的 DNA 结合蛋白有望偶然地对非特异性序列具有一定的亲和力; 带负电荷的基团可以与带正电荷的基团相互作用,芳香环可以插入 DNA 碱基对之间,油腻的侧链可以嵌入口袋中,取代水分子。 令人遗憾的是,ENCODE 的作者决定部分地根据可能与生物学相关或可能与生物学无关的化学相互作用来定义生物学功能。
ENCODE 发现引起的轩然大波表明,科学家们继续在一个无序和无目的的宇宙中寻找秩序和目的,而这个宇宙仍然可以产生非常美丽的结构。 他们希望为自然界中的一切事物找到目的,并且不断寻找隐藏在噪声中的信号。 这种追求符合我们根深蒂固的模式识别感,并且经常带来伟大的发现。 但是,自然的随机性、偶然性和随意性意味着有时噪声就是噪声。 如果我们想了解自然的真实面目,我们就必须接受这个真理。