人类基因组的螺旋、环和球体进入 4-D 视图 [视频]

探索双螺旋结构的奥秘,揭示生命微妙的基因编排

来自 《量子杂志》 (查找 原始故事)。

五十万个人体细胞的细胞核可以全部装入一颗罂粟籽中。然而,每个细胞核内都存在着极其庞大的基因组机器,至少从分子角度来看是如此。它有数十亿个部件,其中许多用于激活和沉默基因——这种排列使得单个细胞能够专门化为脑细胞、心细胞和大约 200 种其他不同类型的细胞。更重要的是,每个细胞的基因组都充斥着数百万个移动片段,这些片段在细胞核中蜂拥而至,并在此处和彼处附着,以微调遗传程序。每隔一段时间,基因组机器 就会自我复制。

人类基因组微型机器的核心是两米长的 DNA,它体现了一个人 30 亿个遗传字母或核苷酸。美国国家癌症研究所(位于马里兰州贝塞斯达)基因组细胞生物学小组负责人汤姆·米斯特利说,如果将你体内数万亿个细胞中的所有基因组都拉出来,可以绕太阳 50 个来回。自 1953 年詹姆斯·沃森和弗朗西斯·克里克揭示 DNA 结构以来,研究人员在拼写这些遗传字母方面取得了惊人的进展。但是,这种信息存储的观点几乎没有揭示是什么让特定基因在不同的时间、不同的组织类型、一个人一天或一生中的不同时刻开启或关闭。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


为了弄清楚这些过程,我们必须了解这些遗传字母是如何集体螺旋、盘绕、收缩成环、聚集成域和球体,并在其他方面呈现细胞核范围内的结构的。“DNA 的美丽让人们忘记了基因组更大规模的结构,”马萨诸塞大学医学院(位于伍斯特)的分子生物学家乔布·德克尔说道,他构建了一些用于揭示基因组几何结构的最重要的工具。“现在我们又回到研究基因组的结构,因为我们意识到 DNA 的三维结构将告诉我们细胞实际上是如何使用信息的。基因组中的一切只有在三维空间中才有意义。”

像德克尔这样的基因组考古学家发明并部署了分子挖掘技术,以揭示基因组的结构,希望最终能够辨别出所有这些结构是如何帮助编排地球上的生命的。在过去的十年左右,他们一直在揭示基因组中嵌套的结构基序,这些基序对于每个细胞的身份和活动都与双螺旋一样基本。

更好的基因显微镜
对基因组机器的深入研究已经进行了很长时间。早期的英国显微镜学家罗伯特·胡克因其 17 世纪中期对薄片软木塞的观察而创造了细胞这个词。他看到的小隔间让他想起了僧侣的住所——他们的牢房。到 1710 年,安东尼·范·列文虎克已经窥探到细胞内的小隔间,尽管是布朗运动的罗伯特·布朗在 1830 年代早期创造了细胞核这个词来描述这些隔间。半个世纪后,在 1888 年,德国解剖学家海因里希·威廉·戈特弗里德·冯·瓦尔德耶-哈茨透过他的显微镜观察,并决定使用染色体这个词——意思是“彩色体”——来表示他和其他人用当时最好的显微镜在细胞核内看到的微小、吸色线的线程。

在 20 世纪,生物学家发现染色体中的 DNA,而不是它们的蛋白质成分,是遗传信息的分子化身。包含在 23 对染色体中的 DNA 总和就是基因组。但是,这些染色体是如何组合在一起的,在很大程度上仍然是一个谜。

然后在 1990 年代初期,凯瑟琳·卡伦和范德比尔特大学的一个团队开发了一种方法,可以人为地融合细胞核中附近的 DNA 片段——这是一项开创性的壮举,使得仅仅通过读取 DNA 序列来分析 DNA 的超折叠结构成为可能。多年来,这种方法得到了改进。它的最新迭代之一称为 Hi-C,可以绘制整个基因组的折叠图谱。

Hi-C 实验的第一步是用甲醛处理数百万个细胞的样本,甲醛具有化学作用,可以在两条 DNA 链恰好靠近的地方将它们交联。这两个附近的片段可能沿着同一条染色体弯曲回自身一段距离,或者它们可能位于分开但相邻的染色体上。

接下来,研究人员将基因组切碎,收集数百万个交联的片段,并对每个片段的 DNA 进行测序。测序后的片段就像 3-D 基因组中 DNA-DNA 接触的特写照片。研究人员将这些片段映射到现有的全基因组序列数据上,以创建基因组接触点的列表。这种匹配练习的结果是惊人的数据丰富的地图——它们看起来像嵌套的、颜色编码的不同大小的正方形的被子——指定了染色体的任何两个片段(甚至整个基因组的两个片段)在细胞核中物理上彼此靠近的可能性。

到目前为止,大多数 Hi-C 数据都描绘了使用从样本中所有细胞中汇集的接触命中率的平均接触图。但是研究人员已经开始推动这项技术,以便他们可以从单个细胞中收集数据。新兴的能力可能会产生迄今为止最准确的细胞核内染色体和基因组的 3-D 渲染图。

此外,贝勒医学院基因组结构中心主任埃雷兹·利伯曼·艾登和他的同事最近对完整细胞核中的 DNA-DNA 接触进行了编目,而不是对先前必须从细胞核中提取的 DNA 进行编目,这一步骤为数据增加了不确定性。更高分辨率的接触图使研究人员能够在 1,000 个遗传字母的尺度上辨别基因组结构特征——分辨率比以前精细约 1,000 倍。这就像直接查看汽车引擎盖下,而不是从几个街区外眯着眼睛看引擎。研究人员在 2014 年 12 月 18 日的Cell杂志上发表了他们对九种细胞类型的看法,包括人和小鼠的癌细胞。

环的力量
艾登和他的同事使用复杂的算法来分析这些细胞中数百万个——在某些情况下是数十亿个——接触点,他们可以看到这些基因组收缩成大约 10,000 个环。细胞生物学家已经知道基因组环数十年了,但以前无法以现在可能的分子分辨率和细节来检查它们。哈佛大学博士生,Cell文章的合著者米里亚姆·亨特利说,这些环的流体形状被德克尔比作“所有卷曲起来的蛇”,揭示了以前看不见的基因组大规模结构可能影响特定基因开启和关闭的方式。

在不同的细胞类型中,环在不同的特定染色体位置开始和结束,因此每条细胞系的基因组似乎都具有独特的环群。这种分化可能提供结构基础,以帮助解释具有相同整体基因组的细胞如何能够分化成数百种不同的细胞类型。“3-D 结构与细胞运行的程序相关,”艾登说。

这些环做什么?米斯特利想象它们在细胞核的液体内部“在微风中摇曳”。当它们彼此靠近和远离时,其他蛋白质可能会猛扑进来并稳定瞬时环结构。在这一点上,一种称为转录激活因子的特定类型的蛋白质可以启动基因开启的分子过程。

米斯特利推测,每种细胞类型——例如肝细胞或脑细胞——都可能具有这些瞬时环-环相互作用的标志性网络。环结构可以决定哪些基因被激活,哪些基因被沉默。

然而,研究人员谨慎地指出,他们只发现了结构和功能之间的关联——现在确定其中一个是否导致另一个,以及因果箭头指向哪个方向还为时过早。

当艾登、亨特利和他们的同事挖掘他们关于环间相互作用的数据时,他们还能够辨别出基因组中的六个更大的结构特征,称为亚区室。艾登将它们称为“细胞核中的空间邻域”——相当于纽约市的市中心或格林威治村的核酸。正如人们倾向于倾向于一个或另一个社区一样,不同的染色体片段携带某种用于特定亚区室的分子邮政编码,并且倾向于滑向它们。

这些分子邮政编码是用染色质编写的,染色质是构成染色体的 DNA 和蛋白质的混合物。当 DNA 缠绕在数百万个线轴状蛋白质结构(称为核小体)上时,就会构建染色质。(这种缠绕是为什么两米长的 DNA 可以塞进直径仅为三十万分之一宽的细胞核内的原因。)

大量的生物分子参与者将这种扭曲的染色质的不同区域微调成更封闭或开放的形状。基因组机器的游走部分可以更好地访问开放区域,因此更有机会开启位于那里的基因。

基因组如何折叠?研究人员使用折纸来解释他们的发现。
 

像德克尔、米斯特利、艾登及其同事这样的研究人员一直在构建的基因组日益详细的分层图景大致如下:核苷酸组装成著名的 DNA 双螺旋。螺旋缠绕在核小体上形成染色质,染色质反过来缠绕和缠绕成类似于当你不断扭曲一根线的两端时得到的形状。在所有这些之中,染色质在此处和彼处收缩成数千个环。这些环,无论是在同一条染色体上还是在不同的染色体上,都在亚区室中彼此接合。

随着研究人员逐渐更深入地了解基因组的结构层次,他们将更接近于弄清楚这种巨大的、具有机械细节的宏分子奇迹是如何运作的。美国国立卫生研究院启动了一项为期五年、耗资 1.2 亿美元的名为“4D 核组”的计划,该计划肯定会在核结构研究界建立势头,欧洲也正在启动一项类似的倡议。正如美国国立卫生研究院网站上所述,该计划的目标是“了解空间和时间(第四维度)中细胞核三维组织背后的原理、核组织在基因表达和细胞功能中的作用,以及核组织的变化如何影响正常发育以及各种疾病。”

或者,正如德克尔所说,“它最终将使我们能够看到活体基因组在行动,这将最终告诉我们它是如何实际运作的。”

经《量子杂志》许可转载,《量子杂志》是 SimonsFoundation.org 的一个编辑独立的部门,其使命是通过报道数学、物理和生命科学的研究进展和趋势来提高公众对科学的理解。

© . All rights reserved.