SARS-CoV-2,即导致 COVID-19 的病毒,看起来是什么样的?
这个简单的问题没有简单的答案。SARS-CoV-2 非常小,观察它需要专门的科学技术。电子显微镜 (EM) 可以揭示它的大概大小和形状。我们可以看到病毒粒子是球形或椭球形的,表面有“冠状”突起。对许多病毒粒子的仔细冷冻电子显微镜 (cryo-EM) 研究可以揭示更精确的病毒及其较大片段的测量结果。可以使用冷冻电镜、X 射线晶体学或核磁共振波谱学,将这些单独的片段与病毒分离进行研究,从而获得原子或近原子细节的 3-D 模型。
然而,即使是这些技术也可能无法捕捉到柔性和无序的部分,留下灰色区域和歧义。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和思想的具有影响力的故事的未来。
以分子细节构建像 SARS-CoV-2 这样的完整病毒的 3-D 模型 需要研究、假设和艺术许可的结合。有些结构是已知的,有些结构是略微已知的,还有一些结构可能是完全未知的。
当我构建 在七月份的《大众科学》杂志上展示的模型时,在几个地方我不得不根据现有证据做出最佳猜测的决定。这个模型并不完美;随着对 SARS-CoV-2 的科学理解不断发展,毫无疑问,它的某些部分可能需要更新。
该模型所依据的许多研究都是针对 SARS-CoV 进行的,SARS-CoV 是 2003 年爆发的 SARS 疫情的冠状病毒。SARS-CoV 与 SARS-CoV-2 密切相关,并且结构非常相似。它们引起的疾病的差异可能是非常小的分子特征造成的,当观察整个病毒粒子时,这些特征几乎不可见。我一开始就决定根据需要使用 SARS-CoV 数据。关于 SARS-CoV-2 的研究仍在进行中,对 SARS-CoV 进行的非常仔细的超微结构研究尚未在 SARS-CoV-2 上进行。
在这里,我将逐步介绍病毒粒子的每个组成部分,并回顾我发现的有关其结构的证据,以及我在哪里不得不使用假设或艺术许可来弥合差距。
总体结构
在电子显微镜下,SARS-CoV-2 病毒粒子看起来是球形或椭球形的。科学家测得的直径范围从 60 到 140 纳米 (nm)。(这大约是人类头发宽度的千分之一)。然而,在构建此模型时可用的测量数据来自负染色电子显微镜,其分辨率不如冷冻电镜精细。
为了获得更精确的测量结果,我参考了一项 2006 年对 SARS-CoV 进行的细致冷冻电镜研究。研究人员在其中报告了平均直径为 82 到 94 纳米,不包括刺突蛋白。我最终将我的病毒粒子模型构建为球形,直径为 88 纳米。这项研究还报告了表面结构蛋白的相对量;以下描述了每种测量结果,并附有相关蛋白质。

刺突 (S) 蛋白。来源:Veronica Falconieri Hays
刺突 (S) 蛋白
刺突 (S) 蛋白从病毒表面伸出,使其能够附着并与人类细胞融合。刺突的顶部,包括附着域和部分融合机制,已在 2020 年 3 月之前由两个研究小组(Veesler 实验室 和 McClellan 实验室)通过冷冻电镜绘制出 3-D 图。然而,刺突的茎、跨膜域和病毒粒子内部的尾部尚未绘制图谱。科学家们知道这些区域存在,以及它们包含哪些氨基酸(蛋白质构建块),但尚未能够观察到它们在 3-D 空间中的排列方式。
包含茎是我模型与许多 SARS-CoV-2 可视化模型之间的关键区别。大多数模型,包括 标志性的 CDC 图像,都使用刺突顶部的 3-D 数据,但不显示茎,从而导致刺突模型较短。
起初,我在示意图中建模了一个茎,所以刺突看起来有点像棒棒糖。我将其与 SARS-CoV 测得的刺突高度和间距相匹配,大约 19 纳米高,间距 13–15 纳米。
然而,在科学推特上,我看到了加州大学圣地亚哥分校的 Lorenzo Casalino、Zied Gaieb 和 Rommie Amaro 发布的帖子,展示了刺突及其附着的糖链的 分子动力学视频。他们基于与已知 3-D 结构的氨基酸序列相似性,构建了一个完整的刺突模型,包括茎、跨膜域和尾部。该模型是他们为了更多地了解刺突行为的分子动力学研究(现为预印本)所必需的。他们慷慨地与我分享了他们的模型,以便将其纳入我的可视化模型中。
值得注意的是,Amaro 实验室的模型高 25 纳米,比我根据 SARS-CoV 的测量结果预期的要高 6 纳米。我没有解决这种差异,但我的假设是,在实际的病毒粒子上,刺突茎会弯曲,在电子显微镜下看起来会更短,并且/或者刺突顶部的柔韧性会模糊其边界,这使得即使通过冷冻电镜进行高度测量也有些模棱两可。
还有报告称,基于 负染色电镜图像,SARS-CoV-2 刺突的高度为 9–12 纳米。然而,负染色电镜的分辨率不如 冷冻电镜,而冷冻电镜被用于进行 19 纳米的测量。SARS-CoV-2 的刺突蛋白的氨基酸数量也与 SARS-CoV 的刺突蛋白相似(分别为 1,273 个和 1,255 个),因此 SARS-CoV-2 的刺突蛋白不太可能像这些基于负染色的测量结果所暗示的那样小。

膜 (M) 蛋白。来源:Veronica Falconieri Hays
膜 (M) 蛋白
膜 (M) 蛋白是一种小而丰富的蛋白质,嵌入在病毒的包膜中,其内部有一个尾部,据认为可以 与 N 蛋白相互作用(如下所述)。与刺突茎一样,M 蛋白尚未在 3-D 中绘制图谱,也没有任何类似的蛋白质。SARS-CoV 和 SARS-CoV-2 M 蛋白的大小相似(分别为 221 个和 222 个氨基酸),并且 基于氨基酸模式,科学家们假设 M 蛋白的一小部分暴露在病毒膜的外部,一部分嵌入在膜中,一半在病毒内部。基于此信息,我基于两种略微相似的蛋白质(蛋白质数据库条目 4NV4 和 5CTG,由 SwissProt 鉴定)的部分组装了一个模型。病毒内域的模型有一个长尾,但我无法自信地定向它,并且发现它指向奇怪的方向,所以我将其切掉,以避免视觉干扰或暗示错误的结构特征。
M 蛋白 形成对,据估计,病毒表面每个刺突蛋白上有 16–25 个 M 蛋白。我最终在我的模型中为每个刺突蛋白建模了 10 对 M 蛋白(因此是 20 个 M 蛋白)。一些研究人员假设 M 蛋白在包膜内形成晶格(与 N 蛋白的底层晶格相互作用;见下文)。我决定使用二十面体球体来创建 M 蛋白二聚体的规则分布,以暗示这一假设。

N 蛋白。来源:Veronica Falconieri Hays
N 蛋白
核蛋白(N 蛋白)与 RNA 基因组一起包装在病毒粒子内部。据认为它在包膜下方形成类似晶格的结构,病毒刺突只能在 N 蛋白之间容纳,防止它们的间距 小于 13–15 纳米。
N 蛋白由两个相对刚性的球状 结构域组成,这两个结构域通过一个长的无序连接区连接。两个结构域 NTD 和 NTD 和 CTD 的结构分别是针对 SARS-CoV-2 和 SARS-CoV 确定的,但它们彼此之间的确切方向有点神秘。根据连接域的无序性,它可能是高度可变的。
CTD 的结构是通过 X 射线晶体学确定的,这是一种需要结晶蛋白质纯化拷贝的技术。在这个结晶过程中,CTD 形成了一个有趣的八件式结构,如果堆叠起来,会形成一个螺旋核心。这并非最终结论,但高度暗示病毒 RNA 可以包裹在这个核心周围。N 蛋白的另一半 NTD 可能随后在 RNA 外部相互作用,或者,在它靠近 M 蛋白和病毒包膜的地方,转而附着在那里。这将形成观察到的包膜下 N 蛋白晶格,并将使整个 RNA-N 蛋白复合物尽可能靠近膜。
在创建此模型时,建模数百个 N 蛋白拷贝的技术挑战太大而无法解决,每个 N 蛋白都由无序氨基酸链连接的两个结构域组成。我决定在病毒刺突下方放置一个 NTD 晶格,为 RNA-N 蛋白复合物构建一个螺旋 CTD 核心,并添加与 RNA 相互作用并散布在整个病毒粒子中的 NTD。我将核心的螺旋延伸到病毒中心;这是我解决包装极长的 RNA 链(如下所述)的方案,但实际上,RNA 和 N 蛋白在病毒中心可能更加无序。最终结果捕获了一些关于 N 蛋白如何包装在内部的想法,即使不是其完整和动态的复杂性。

RNA。来源:Veronica Falconieri Hays
RNA
SARS-CoV-2 的基因组有 29,903 个 RNA 碱基,与类似的病毒相比非常长。我想确保我的 RNA 模型近似于基因组的长度。然而,RNA 结构可能很复杂;某些区域的碱基可以与其他碱基相互作用,形成环和“发夹”,并导致非常复杂的 3-D 形状。对于此模型,我假设 RNA 是一根拉伸的线,整齐地缠绕在 N 蛋白核心周围。我找到了一篇 1980 年的研究论文,该论文报告称,每纳米有 4-4.8 个 RNA 碱基,对于建模到病毒粒子横截面中的一半基因组,大约为 3,000 到 3,750 纳米。
起初,当我进行此计算时,我差了一个数量级。将 300 纳米 RNA 放入病毒粒子中是轻而易举的事!经过审查,加州大学伯克利分校的病毒学家 Britt Glaunsinger(该项目的顾问)指出,应该有更多的 RNA,我重新检查了我的计算,并发现了我的错误。我需要将至少 3,000 纳米挤入病毒粒子横截面内 80 纳米宽的空间中;这需要更多 3-D 微调。一旦我在外围附近用完了空间,我就将 RNA 和 N 蛋白的螺旋继续延伸到病毒粒子的中心。

E 蛋白。来源:Veronica Falconieri Hays
E 蛋白
包膜 (E) 蛋白是一种五重对称的 分子,在病毒膜中形成孔。在细胞内病毒复制期间会产生许多拷贝,但只有极少数被纳入成熟的病毒粒子中。科学家们尚未在 3-D 中绘制 SARS-CoV-2 E 蛋白的图谱,但有一个实验衍生的 SARS-CoV E 蛋白模型,其相似度约为 91%。我在这里使用了该模型。

包膜。来源:Veronica Falconieri Hays
包膜
SARS-CoV-2 包裹在从宿主细胞内细胞器膜(特别是内质网和高尔基体)衍生的脂质双层中。我用通用脂质表示这一点:一个头和两个尾巴。如果有更多时间,这可以更详细。脂质有很多不同的类型,其比例特定于起源膜。
汇集在一起

病毒粒子草图。来源:Veronica Falconieri Hays

病毒粒子草稿,已标记。来源:Veronica Falconieri Hays
粗略草图和初始 3-D 模型
在获得病毒粒子的快速手绘草图的签字认可,以确保包含所有必要的细节后,我开始同时在 3-D 建模和动画程序 Cinema4D 中研究和构建 3-D 模型。在 Cinema4D 中,我创建了一个 88 纳米球体作为基础,然后将分子模型的副本定向到其表面或内部。随着我的研究进展,我修改了它们的分布,并根据需要进行了计数、测量和计算。我使用 嵌入式 Python 分子查看器 (ePMV) 插件直接导入可用的 3-D 分子数据。

渲染颜色指南。来源:Veronica Falconieri Hays
初始颜色研究
我使用了所得模型的基本 2-D 图像来试验颜色,然后将该调色板用作创建材质和在 3-D 中设置灯光的起点。

颜色研究 1。来源:Veronica Falconieri Hays

颜色研究 2。来源:Veronica Falconieri Hays
3-D 颜色研究
起初,我设想了一个温暖的粉红色背景,就好像仔细观察人体组织中一个不可能光线充足的角落一样。然而,我在 2-D 中尝试了较暗、较冷的背景,发现我喜欢它如何使刺突蛋白的冠状结构突出。艺术总监 Jen Christiansen 也喜欢这个方向,所以我将较暗背景的版本改进为《大众科学》2020 年 7 月号封面上的插图。
致谢
我要感谢医学插画家协会 (AMI) 的同行们,感谢他们在 Michael Konomos 牵头的努力中分享他们的研究。还要感谢 Nick Woolridge、David Goodsell、Melanie Connolly、Joel Dubin、Andy Lefton、Gloria Fuentes 和 Jennifer Fairman 的来信和可视化,这些帮助我进一步理解了 SARS-CoV-2。感谢《大众科学》的 Jen Christiansen 提供的艺术指导,并感谢她在我制作这件作品期间容忍我发送的许多深度书呆子式的电子邮件。