一项旨在详尽编目人类基因组所有功能的庞大项目的首批结果揭示了基因间隙中存在着活跃的活动。一个国际研究联盟筛选了1%的基因组,寻找被细胞复制或有助于控制基因活动的DNA片段。结果表明,大部分DNA都被复制成RNA分子,包括基因之间的长片段,并且基因之间的重叠和相互作用比研究人员之前认为的要多得多。
“我们都怀疑这些区域[基因之间]正在发生一些有趣的事情,果然如此,”该项目计算机分析团队的成员、英国剑桥附近欧洲生物信息学研究所的生物信息学家伊万·伯尼说。
尽管研究人员尚不清楚这些发现的生物学意义,但他们表示,对基因组进行完整编目可能有助于他们了解基因变异如何影响罹患癌症等疾病的风险,以及人类如何从单细胞胚胎成长为成年人。该项目的下一阶段将于今年晚些时候开始,届时将尝试对整个基因组进行清点。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。 通过购买订阅,您将有助于确保关于塑造我们当今世界的新发现和想法的具有影响力的故事的未来。
基因组仅由四种不同的核苷酸碱基或DNA亚单位组成,并以特定的顺序排列。2001年人类基因组的发布揭示了它的序列,但其意义仍然是个谜。特别是,基因仅占基因组30亿个碱基的1.2%。曾经被视为“垃圾DNA”的这些所谓非编码区域,研究人员发现其中一些在哺乳动物中是共享的,这表明它们发挥着重要作用。
为了帮助揭示这些功能并识别其他重要序列,35个研究小组于2003年联合创建了DNA元件百科全书(ENCODE)项目。该联盟选择了基因密度从高到低以及小鼠和人类之间的相似性从高到低的44个独立的基因组片段。
就像寻宝者用金属探测器梳理广阔的沙滩一样,ENCODE研究人员以多种方式筛选了他们的基因组区域,结果与描述一起发表在今天在线发布的《自然》杂志论文和《基因组研究》的特刊中。
该项目的一个主要部分是识别细胞复制或转录成RNA分子的序列。细胞从基因复制的RNA制造蛋白质,但一些RNA本身也发挥作用。此外,一些研究发现,从果蝇和蠕虫到人类的物种都会从非编码DNA复制大量的RNA,但没有明显的目的。尽管如此,耶鲁大学的生物信息学家和联盟成员马克·格斯坦因说:“在ENCODE之前,我认为很多人都对基因间活动的真实性持怀疑态度。”
尽管基因仅占ENCODE序列的3%,但该联盟发现93%的序列被转录。研究人员报告说,一些转录本来自非编码DNA,但那些与399个ENCODE基因匹配的转录本彼此之间广泛重叠。
分子生物学家和联盟成员、位于加利福尼亚州圣克拉拉的基因组技术公司Affymetrix的汤姆·金格拉斯表示,65%的基因转录本都包含了来自基因外部相对较远甚至来自其他一两个基因的DNA片段。研究人员知道,细胞将单个基因切成称为外显子的较短片段,然后将它们混合搭配成一个转录本,用于创建蛋白质。金格拉斯表示,ENCODE的发现证实了最近的报告,即人类和果蝇有时会组合来自两个不同基因的外显子。
根据转录序列,研究人员在基因内部或之间识别出1437个新的启动子——转录开始的短DNA序列,这还不包括他们已知的1730个启动子。伯尼说,每个基因几乎有十个启动子。他补充说,重叠每个基因的大量转录本表明,“基因”这个词在细胞核内部(转录发生的地方)和外部(成品蛋白质去的地方)的含义应该有所不同。
项目成员还编目了标记DNA区域的序列,这些区域的DNA从维持染色体形状的圆形组蛋白中解开,从而允许细胞的转录机制激活这些区域的基因。伯尼说,他们发现了一些可能解开的区域,这些区域远离启动子,因此可能发挥着其他作用。
该联盟发现,5%的研究序列在23种哺乳动物中被保存下来,这表明它发挥的作用足够重要,以至于进化过程可以保存下来,而物种也随之进化。但在所有被确定为可能重要的新ENCODE序列中,只有一半属于保守组。
伯尼说,这些不保守的序列可能是“旁观者”——基因组其他功能的结果——既不帮助也不伤害细胞,并且可能为过去的进化提供了素材。
安大略省圭尔夫大学的基因组研究员T·瑞安·格雷戈里(他不是该联盟的成员)说,它们也可能只是维持有用的DNA结构或DNA片段之间的间隔,而不管其特定的序列如何。
“目前,生物学见解主要是渐进式的,”位于休斯顿的贝勒医学院的基因组生物学家乔治·韦恩斯托克说,他表示这对于这样的试点研究来说是预料之中的。“这是一个像基因组项目一样的‘社区资源’项目,它向社区提供了大量新数据,然后社区可以深入研究并从中挖掘发现。”
格雷戈里说,结果虽然仍然神秘,但确实暗示了新的功能和一个更复杂的基因组。“这项研究向我们展示了我们距离全面了解人类基因组还有多远。”