十年前,人类基因组序列的发布为世界提供了一份人类蓝图。但正如汽车零件清单无法告诉我们汽车发动机如何工作一样,完整的基因组序列——人类细胞所有染色体中DNA“字母”的列表——并没有揭示基因组如何指导我们细胞的日常活动,或如何让个体从受精卵发育成功能健全的成年人。
为了更好地理解基因组作为一个整体如何协调被称为生命的生物活动交响曲,我和基因组细胞生物学这个新领域的其他研究人员正在研究染色体及其包含的基因如何在细胞核的三维空间内排列,以及这种组织如何影响它们的活动。
借助新的3D成像技术,使我们能够比以往任何时候都更深入地观察活细胞,我们发现了一个令人惊讶的充满活力的生态系统。在细胞核中,染色体与相邻染色体物理相互作用,这些染色体上的基因会根据它们需要完成的任务迁移到不同的核位置,而调节基因活性的分子则聚集在繁忙的中心。这些新发现为我们的基因组如何维持我们的健康以及某些疾病(包括某些癌症)如何产生提供了新的见解;它们也可能为诊断疾病带来新的方法。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们今天世界的发现和想法的具有影响力的故事的未来。
早期问题
最近的进展源于20世纪80年代的发现。那时,生物学家知道染色体在细胞分裂过程中会高度凝缩,呈现出沙漏状结构,当我们想到将我们的基因从一代传递到下一代的实体时,我们大多数人都会想到这种结构。他们也知道,当细胞不分裂并进行日常活动时,染色体具有更松散的形状。这种松散的外观使得即使使用最好的显微镜也难以辨别单个染色体,而普遍的观点认为,不分裂细胞中的染色体像意大利面一样混杂在一个碗里。
尽管有一些相反的暗示,但这种观点仍然很普遍。在20世纪初,一位名叫西奥多·博韦里的德国细胞科学家反对这种染色体组织的“意大利面模型”。根据他对一种感染马匹的蛔虫的研究,他认为,尽管染色体在细胞的生命周期中可能会发生大小和形状的变化,但每条染色体都占据细胞核中一个独特的、明确定义的区域。他将这些由单个染色体占据的区域命名为“染色体领域”。但由于染色体难以观察——而且由于博韦里的蛔虫不是典型的实验系统——他的染色体领域概念长期以来一直被边缘化。
染色体领域概念的明确实验证据直到另外两位德国人,托马斯·克雷默和克里斯托夫·克雷默兄弟开发出一种标记和可视化细胞核小区域遗传物质的方法后才出现。在20世纪80年代早期,克雷默兄弟表明,当激光束照射细胞核特定区域的DNA时,只有少数染色体会被标记出来。如果核DNA像之前认为的那样混乱地混合在一起,那么每次激光脉冲都会击中更多的染色体。
几年后,研究人员完善了一种更有针对性和色彩鲜艳的方法来标记和可视化整个染色体。这种方法——被称为染色体绘画——将荧光标记标签附着到单个染色体中DNA代码字母的序列上。每条染色体都可以用特定的荧光标记进行标记,并精确定位其位置。这些研究明确地证明,染色体在细胞核中以不同的实体存在,占据着与其他染色体分离的空间。
这一发现引发了许多问题,基因组细胞生物学家正在解决这些问题。染色体是否像开放座位的活动参与者一样,随机分散在整个细胞核中?还是染色体在细胞核内有“指定座位”?更重要的是,它们的位置是否影响它们所携带基因的活性?
偏爱的邻域
我们现在知道,单个染色体倾向于占据细胞核内的首选位置。例如,在人类白细胞中,18号染色体通常紧贴细胞核外壁,而19号染色体则倾向于留在中心;与此同时,7号染色体倾向于悬停在两者之间。每条染色体倾向于占据更靠近或更远离核边缘的首选位置,这也创造了整个细胞核中不同的邻域。因此,每条染色体都有一组邻居,在给定类型的细胞中,这些邻居通常是一致的。例如,在对小鼠白细胞的研究中,我的同事和我发现12号染色体经常与14号和15号染色体聚集在一起。
然而,染色体的位置并非一成不变。我的实验室发现,染色体在不同细胞类型中的排列方式不同,其他研究人员也发现,这些排列方式在发育和疾病过程中会发生变化。更重要的是,染色体所处的位置似乎会影响其携带的基因是否开启或关闭。
一个暗示基因在细胞核内的位置可能对其活性很重要的线索来自一项发现,即某些基因的活性发生变化时,它们的位置也会发生变化。一个例子来自对一个名为GFAP基因的追踪研究。星形脑细胞,称为星形胶质细胞,通常有一个基因的活跃副本(用于制造基因指定的蛋白质的副本)和一个沉默副本。我实验室的Takumi Takizawa发现,沉默的版本通常位于细胞核的边缘,而活跃的副本则位于细胞核内部。其他人也发现了编码防御性抗体或免疫球蛋白的基因的类似定位,这些抗体是白细胞在受到入侵者刺激时分泌的。在被外来细胞置于警戒状态的白细胞中,含有IGH基因(编码免疫球蛋白成分)的染色体区域倾向于移动到细胞核中更中心的位置。总之,这些发现指向了一个简单的规则,即基因的位置如何影响其功能:细胞核外围的基因通常处于非活动状态。
细胞核外侧的某些东西是否有利于基因沉默?一个早期的迹象表明答案是肯定的,那是20世纪30年代的观察结果,即细胞核外围排列着异染色质——高度浓缩的染色体区域。如果你拥有超自然视觉,并且可以观察染色体内部,你会看到它由双螺旋DNA组成,这些DNA缠绕在由称为组蛋白的蛋白质组成的线轴上,而这种线轴化的DNA会自身折叠,形成称为染色质的粗纤维。染色质纤维本身会进一步折叠,变得越来越浓缩。异染色质是染色质的一种特殊形式,它特别紧密地盘绕,这种排列通常会阻止基因读取蛋白质访问底层的DNA。
当然,早期的观察结果无法揭示外围是否促进沉默——或者致密的染色质是否因其他原因被吸引到该区域。但是,几个实验室在2008年进行的一系列精巧的实验支持第一种观点。当研究人员将活性基因从它们在细胞核内部的常规位置移除,并将它们束缚到包围细胞核的膜上时,它们的活性通常会降低。因此,细胞核外围有助于使至少一些基因保持沉默。
就细胞核内部而言,它也可能为那些需要快速或频繁活动的染色体和基因提供一些特殊的东西:称为转录工厂的蛋白质聚集物集合。这些“工厂”是激活基因所需的细胞成分的聚集体,包括聚合酶(将DNA转录成RNA,RNA随后被翻译成编码蛋白质)以及转录因子(与基因的调控区域结合并启动聚合酶的蛋白质)。
牛津大学的彼得·库克在1993年首次提出了这些工厂的存在,此前他注意到,细胞核中任何给定时间活跃基因的数量远大于聚合酶忙于读取基因的位点数量。解释这种模式的一种显而易见的方法是将多个基因聚集在转录活动的中心,在那里它们共享聚合酶和转录因子。这个想法并非没有先例:数百个编码核糖体RNA(细胞蛋白质生产机制的重要组成部分)的基因在核仁中一起转录——核仁是一种足够大的核内亚结构,可以在显微镜下看到。
健康攸关
基因组细胞生物学家尚未了解所有控制细胞核不同部位基因活动的规则。然而,我们已经表明,基因在核空间中的位置与正常发育和健康相关。
从胚胎干细胞的研究中,已经出现了一个特别引人注目的例子,说明基因组织如何在正常的胚胎发育过程中发生变化。这些细胞是“多能”的通才,具有独特的能力,可以分化成体内220多种特化组织中的任何一种,例如神经细胞、血细胞或肌肉细胞。与完全分化的细胞不同,这些功能灵活的胚胎干细胞缺乏基因沉默的大片异染色质区域。它们也缺乏称为核纤层蛋白的蛋白质,这些蛋白质有助于将非活性DNA束缚到细胞核外围。因此,干细胞基因组中的几乎每个基因都以低水平活跃。
当胚胎干细胞接收到分化成骨细胞或神经元等细胞的信号时,它们的核结构会发生巨大变化。核纤层蛋白出现并连接在一起,形成紧密的、交织的垫子——核纤层——位于核膜下方。据信,这种支持性核纤层可以维持细胞核的形状,并保护染色体免受外部机械压力的影响。但它似乎也参与了正常的基因调控。活性基因较少的染色体片段包含一种特定的结构蛋白,该蛋白将这些区域压缩成异染色质——并将它们与细胞核外围的核纤层蛋白结合在一起。这种隔离使富含基因的区域更靠近内部和基因工厂,从而使其能够活跃起来。因此,核纤层蛋白在胚胎发育过程中的出现使细胞能够通过将不再需要的基因驱逐到边缘来关闭它们。
这种对选定染色体区域的驱逐可能对分化细胞中正常的基因功能至关重要,这一观点得到了对核纤层蛋白异常时发生的情况的观察的支持。核纤层蛋白的突变会导致多种人类疾病,从肌营养不良症和神经系统疾病到早衰。所谓的核纤层蛋白病在广度上是不寻常的:与大多数疾病(其中给定基因的任何突变都会导致相同的疾病)相比,核纤层蛋白的突变会导致异常广泛的疾病谱。细胞生物学家不确定有缺陷的核纤层蛋白是如何导致这些疾病的。一种可能性是它们削弱了核纤层,使其无法保护细胞核免受机械力的影响,结果是脆弱细胞中的大部分基因组受到物理损伤,可能导致细胞死亡。另一种有趣的观点是,有缺陷的核纤层蛋白可能在组织基因组的能力方面受到损害,从而将基因放置在错误的位置,并可能破坏其正常功能。
对患有核纤层蛋白相关疾病的患者细胞中染色体位置进行定位的研究倾向于支持最后一种理论:一项调查显示,在携带核纤层蛋白疾病突变的细胞中,13号和18号染色体的位置异常重定位——从外围到内部。然而,尚不清楚这种染色体重定位是疾病的后果还是促成因素。
染色体定位在某些癌症中起着更明确的中心作用。恶性细胞通常包含染色体“易位”——当一个染色体片段从一条染色体上断裂并附着到另一条染色体上时形成的异常染色体。在某些情况下,这种易位会导致癌症,因为融合会产生一种促进细胞过度增殖的突变基因;在其他情况下,它们只是旁观者。
事实证明,哪些染色体结合形成促癌易位受到染色体在细胞核中位置的影响:在细胞核中一起发现的染色体往往更频繁地融合。以伯基特淋巴瘤为例。许多患有这种疾病的患者在位于8号染色体上的MYC基因和位于14号染色体上的IGH基因之间发生易位;在极少数情况下,MYC与2号染色体上不同的免疫球蛋白基因(称为IGK)发生易位,更罕见的情况是与22号染色体上的IGL基因发生易位。2003年,我实验室的Jeffrey Roix发现,MYC与其三个易位伙伴在细胞核中的平均距离与它们的易位频率精确对应,这表明基因距离与易位概率之间存在联系。此后,在许多其他癌症中也发现了同样的联系。
我的实验室还表明,当染色体断裂时,受损的末端会留在原地附近,并且不会远离它们在断裂时所处的位置。这种观察解释了为什么聚集在同一邻域的染色体比遥远的染色体具有更大的融合概率。它也解释了为什么特定的易位是发生在一种组织而不是另一种组织中的癌症的标志:因为染色体在不同的组织中排列方式不同。因此,例如,在肾细胞中彼此靠近聚集的染色体,在肾肿瘤中比在其他组织(如白细胞)的癌症中更有可能成为易位伙伴,因为在白细胞中,它们通常相距较远。
该领域最令人兴奋的进展之一是认识到,了解染色体通常在细胞核中驻留的位置可能会为癌症检测提供机会。初步实验表明,基因的位置可以帮助指示细胞是否癌变。在我实验室进行的一项乳腺癌初步研究中,Karen Meaburn鉴定了几个基因,这些基因在肿瘤细胞中的位置与正常乳腺组织细胞中的位置不同。事实证明,这些基因是乳腺癌的良好标志物:它们使我们能够以非常高的准确率挑选出癌变组织样本。在恶性细胞中,一些基因的位置甚至在细胞开始表现不良之前就发生了变化。因此,我们有理由希望,基因位置分析有一天将成为帮助医生在非常早期阶段诊断癌症的强大分子工具。
自组织的细胞核
基因组细胞生物学领域的圣杯问题是,是什么决定了基因或染色体在细胞核中的位置。基因和染色体如何知道去哪里——以及当它们所在的细胞分化成其特化状态时,它们如何到达那里?
一种理论上的可能性是,染色体序列由特定的细胞机制护送到其适当的目的地。也许一种识别特定基因序列的DNA结合蛋白附着到该序列,然后——在分子马达蛋白的帮助下——将染色体的该部分拖到细胞核中的特定位点。但到目前为止,还没有人发现这样的系统。而且很难想象一种信号系统,它可以将一组地理坐标传递给一段DNA,指示基因在细胞核中心附近徘徊或拜访其最喜欢的转录工厂。
相反,我提出核定位是自组织的,有点像中学生因为共同的兴趣而聚集在一起形成小团体,而不是因为父母或老师指示他们交往。在这种观点中,基因和染色体在细胞核内部的位置源于它们的活动,而不是由某些外部组织机制决定的。反过来,它们的位置会影响它们的活动。
这种自组织是如何运作的呢?让我们跟踪在一个自组织细胞核中,当分化细胞中的单个基因响应信号(例如,激素)而开启时会发生什么。在信号到达细胞之前,基因处于非活动状态——最有可能隐藏在浓缩染色质的一部分中,甚至可能在紧贴细胞核外围的异染色质块中。当信号到达细胞核时,称为染色质重塑复合物的分子会展开基因及其周围的浓缩DNA,并使该区域更容易被转录机制访问。在一个自组织细胞核中,这种松弛将允许染色质的该段从外围的异染色质中环出并摆动,探索细胞核的新部分。如果运气好,弯曲的环最终会与转录工厂接触。
请注意,基因的这种运动——从细胞核外围到活动中心——是在没有专用运输机制的帮助下发生的,并且完全由基因自身的活动驱动。因此,基因的位置是自决定的。该模型有一个有趣的推论:它表明,虽然基因的核位置不是随机的,但它到达那里的方式可能是随机的。
自组织概念与基因追踪实验的许多结果相符。基因可以从染色体中环出并在细胞核中移动。一些基因甚至将这种转录的“漫游通行证”发挥到了极致。当白细胞受到称为细胞因子的激素刺激时,编码称为MHC II类分子的免疫系统蛋白质的基因会远离它们所在的染色体主体——有时会延伸到细胞核的一半。
同样的原则可能控制着整个染色体的定位。虽然大多数基因的运动都相当微妙,但每个基因都对其染色体最终在细胞中的位置做出了一点贡献。因此,如果自组织是规则,那么人们会预期,包含大部分非活性基因的染色体最终会被拉向细胞核外围更具抑制性的区域,而主要包含活性基因的染色体则会被拖向细胞核内部。
为了检验这一预测,马克·格鲁丁和他在西雅图弗雷德·哈钦森癌症研究中心的同事收集了血液前体细胞,然后触发了它们的成熟。在不同的时间点,收获细胞,并测量数千个基因的活性。与此同时,研究人员监测了这些基因所在的染色体的位置。结果:染色体上基因活性随细胞成熟而变化最多的染色体显示出最大的运动。
这些实验是一个良好的开端,但它们很困难,因为同时在显微镜下监测许多基因组区域的位置非常繁琐。一种潜在的革命性方法,称为Hi-C,可能很快就能解决这个问题。这种方法由马萨诸塞大学医学院的乔布·德克尔开发,通过化学方式将细胞核中彼此接触的所有染色体区域连接在一起,从而瞬间快照基因组的三维结构。使用Hi-C,生物学家应该很快就能够确定来自不同组织、不同时间和不同条件下的细胞核中染色体的位置——并通过将这些模式与活性和非活性基因组进行比较,获得对核组织如何影响功能以及破坏如何导致疾病的前所未有的见解。
产生人类基因组序列草图的第一稿花费了大约10年的巨大努力。基因组细胞生物学家,受渴望了解比序列本身所能揭示的更多的东西的驱动,才刚刚开始揭示基因组在其细胞自然栖息地中的行为方式。这项任务虽然令人振奋,但也令人生畏。鉴于其复杂性,它很可能比当初对人类基因组进行测序花费的时间更长。