蛋白质是生命的组成部分。它们是活细胞的眼睛、手臂和腿。即使是生物学中最具代表性的分子DNA,其重要性首先也是因为它包含指定蛋白质组成的基因。我们身体中的细胞彼此不同——充当神经元、白细胞、嗅觉传感器等等——很大程度上是因为它们激活不同的基因组,从而产生不同的蛋白质混合物。
鉴于这些分子的重要性,人们会认为生物学家早就弄清楚了它们的基本外观和工作原理。然而,几十年来,科学家们接受了一种不完整的图景。他们非常正确地理解,蛋白质由像珠子一样串在一起的氨基酸组成。但他们确信,为了使蛋白质正常发挥功能,其氨基酸链首先必须折叠成精确、刚性的构象。然而,现在越来越清楚的是,许多蛋白质在从未完全折叠的情况下执行其生物学任务;其他蛋白质仅在需要时才折叠。事实上,可能有多达三分之一的人类蛋白质是“内在无序的”,至少具有一些未折叠或无序的部分。
可以肯定的是,生物学家早就知道,像复制DNA或将其转录为RNA的聚合酶这样的酶是复杂的纳米机器,由许多运动部件组成,铰链允许蛋白质的不同片段相互枢转。但这些蛋白质通常被描绘成刚性部分的组合,就像折叠椅的各个部分一样。内在无序蛋白质看起来更像是在沸水中不断晃动的部分煮熟的意大利面。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的有影响力的故事的未来。
十五年前,这种说法似乎完全是异端邪说。今天,科学家们意识到,这种无定形和灵活的特征可能帮助地球上的生命开始,并且它们的灵活性继续在细胞中发挥关键作用,例如,在细胞分裂和基因激活期间。这种新的理解不仅为细胞的基本生物学提供了惊人的新见解,同样令人兴奋的是,它暗示了治疗疾病(包括癌症)的新方法。
完美匹配
刚性三维结构决定蛋白质功能的概念最早出现在1894年。柏林大学的化学家埃米尔·费舍尔提出,酶(生化反应的催化剂)通过与其外表面的特定形状结合来与其他分子相互作用;与此同时,酶会完全忽略表面特征仅略有不同的任何分子。换句话说,酶及其结合伙伴像钥匙和锁一样契合在一起。
在费舍尔提出他的模型时,蛋白质的性质是未知的。在接下来的60年左右的时间里,生物学家了解到蛋白质是氨基酸链,并得出结论,它们必须折叠成精确的形状才能正常工作。1931年,中国生物化学家吴宪为这一观点提供了强有力的支持,表明蛋白质变性或天然三维结构的丧失导致功能的完全丧失。从那时起,从1958年确定了精子鲸肌红蛋白的三维结构开始,研究人员已经确定了超过50,000种蛋白质的结构,通常首先诱导它们的刚性结构形成晶体,然后用X射线散射这些晶体。
然而,在这个结构化的、锁和钥匙的蛋白质世界中,并非一切都是静态的。早在20世纪初,科学家们就知道许多抗体可以与多个靶标或抗原结合——这一观察结果与锁和钥匙模型并不完全吻合。在20世纪40年代,伟大的化学家莱纳斯·鲍林推测,某些抗体可以以多种方式折叠,每种构象的折叠都由抗体和抗原之间的契合度引导。
从大约20世纪40年代开始,各种其他观察表明,并非所有蛋白质都遵守功能源于刚性三维结构的教条。但是,那些不遵守的蛋白质通常被视为孤立的、反常的例外。我们中的一位(邓克)是最早收集此类例子并注意到也许教条本身需要修正的研究人员之一。例如,在1953年,科学家们注意到牛奶蛋白质酪蛋白在很大程度上是非结构化的;这种柔韧性可能有助于婴儿哺乳动物对其进行消化。在20世纪70年代初期,发现一种名为纤维蛋白原的蛋白质包含一个没有固定结构的显著区域;该区域以及后来发现的类似但较小的区域,在血液凝固中起着关键作用。在20世纪70年代后期,形成烟草花叶病毒外壳或衣壳的蛋白质提供了另一个引人注目的例子。当衣壳为空时,该蛋白质具有大的、非结构化的区域,松散地悬挂在衣壳的腔内;这种松散性使在受感染细胞中病毒复制过程中新产生的RNA能够包装在内部。但是,当RNA进入时,蛋白质会与之结合并变成刚性形状。
与此同时,无法诱导某些蛋白质在其试管中折叠的实验者认为他们做错了什么:氨基酸链肯定会在细胞环境中找到“正确”的折叠形状。例如,当研究人员将含有分离蛋白质的溶液放入小瓶中,并用核磁共振(NMR)光谱仪(蛋白质研究的主力)扫描它们时,他们有时会得到模糊的数据,他们将其解释为表明蛋白质未能折叠。
但是,这些数据讲述了一个更丰富的故事。核磁共振光谱学涉及应用强大的射频脉冲,以诱导特定元素(如氢)的原子核同步旋转。原子核响应中的轻微频率偏移与氨基酸内部原子的位置以及这些氨基酸相对于彼此的位置紧密相关。因此,研究人员通常可以从这些频率偏移中拼凑出刚性蛋白质的结构。但是,如果氨基酸移动很多——就像未折叠的蛋白质的情况一样——频率偏移会变得模糊。
1996年,我们中的一位(克里瓦奇,当时在斯克里普斯研究所)对一种名为p21的蛋白质(参与控制细胞分裂)进行核磁共振光谱学研究时,注意到了一些令人震惊的事情。根据他的核磁共振数据,p21几乎完全无序。氨基酸围绕将它们连接在一起的化学键自由旋转,在一种构象中停留的时间不超过一秒的一小部分。然而——这才是令人震惊的部分——p21仍然能够执行其关键的调节功能。这是第一个令人信服地证明缺乏结构不会使蛋白质变得无用的例子。
核磁共振光谱学仍然是确定蛋白质是折叠还是无序的主要技术,并且与其他技术一起,它现在已经证实许多蛋白质是内在无序的。这些分子在布朗运动和自身热抖动的作用下不断变形,但它们的功能却完全正常。
蛋白质意大利面
这种新的、更广泛的观点通过蛋白质p27得到了很好的说明,已知p27存在于大多数脊椎动物中。与p21一样,p27是调节细胞分裂的关键蛋白质之一,因此细胞不会不受控制地繁殖。核磁共振显示,p27具有高度的灵活性,其各个部分快速折叠和展开成短暂存在的螺旋形或片状结构。人类大多数癌细胞中p27的含量减少,损失越大,患者的生存预后越差。
p27分子通过结合并抑制至少六种不同类型的激酶酶的活性,起到细胞分裂的刹车作用。激酶是DNA复制和细胞分裂的主要调节器。它们将磷酸盐(PO4)连接到其他蛋白质(“磷酸化”它们),这一举动会引发一连串的事件。在执行其任务时,线状的、动态的p27分子缠绕在激酶(具有大部分刚性结构)周围,并覆盖其表面的很大一部分,包括其化学反应性或“活性”位点。这种阻断阻止了磷酸化,从而阻止了细胞分裂。因此,由于其灵活性,p27可以围绕不同类型的酶塑造自身并抑制它们。具有这种能力的蛋白质被描述为混杂的或身兼数职的。
p27蛋白质几乎完全是非结构化的,因此它位于从完全无序(完全非结构化)到完全有序(完全刚性折叠)的尺度上的无序端附近。激酶本身位于该尺度的另一端附近。许多其他蛋白质介于两者之间,既有结构化区域,也有非结构化区域。钙调磷酸酶参与免疫反应(并且是抗排斥药物的靶点),它与激酶相反:它从已被磷酸化的特定蛋白质中去除磷酸盐。它具有一个结构化区域,即酶的活性位点,并以经典的锁和钥匙方式操作,以从其他蛋白质中去除磷酸盐。但它也有一个非结构化区域,当不需要去除磷酸盐时,该区域会结合并灭活酶自身的活性位点。因此,钙调磷酸酶就像两种蛋白质合二为一:结构化区域执行催化作用,而非结构化区域调节这种催化功能。
到目前为止,我们讨论的例子是蛋白质在执行其功能时折叠——无论是自身折叠还是围绕其他蛋白质折叠。但是,无序通常是蛋白质工作机制的一部分。在一个已知的例子中,非结构化区域的长度充当计时装置,控制两个结合位点结合在一起的速度:如果非结构化区域较长,则两个结合位点彼此搜索的时间比非结构化区域较短时更长。在另一个实例中,非结构化使特定蛋白质能够穿过狭窄的开口并穿过细胞膜。非结构化蛋白质存在于神经细胞的轴突中,在那里它们形成刷状结构,防止轴突塌陷。
出乎意料的是,即使在结合后,某些蛋白质仍然是非结构化的。在多伦多儿童医院,坦娅·米塔格(现任克里瓦奇系教员)最近在酵母中发现了一种抑制蛋白Sic1,它通过几个连续跳上和跳下单个结合位点的片段与伴侣保持连接,而Sic1的其余部分仍然无序。
无序也存在于较简单生物甚至病毒的蛋白质中。一些被称为噬菌体的病毒,专门感染细菌,通过连接到噬菌体主体的柔性连接蛋白连接到宿主膜。附着蛋白比整个噬菌体更小、移动速度更快,然后可以快速重新定向以优化其在对接过程中的对齐。
广泛的混杂性
迄今为止,全球各地实验室的研究人员已经直接鉴定出大约600种部分或完全非结构化的蛋白质,并了解了它们的功能。但我们怀疑存在更多。毕竟,科学家们迄今为止只了解了估计存在于人体内的约100,000种蛋白质中的一小部分结构。此外,邓克及其合作者的新“生物信息学”研究也指向了这一方向。
生物信息学方法建立在早期对单个蛋白质的理论研究之上,这些研究表明,在细胞合成氨基酸链以制造蛋白质后,该链的折叠方式取决于其组成。特别是,体积大且疏水的氨基酸——意味着它们“不喜欢”自然包围蛋白质的水分子——倾向于最终位于内部。相反,最终位于给定折叠蛋白质表面的那些氨基酸通常是小的且亲水的——它们倾向于粘附到周围的水分子。
邓克的想法是将已知内在无序蛋白质的氨基酸序列与已知具有刚性折叠形状的蛋白质的氨基酸序列进行比较。他的团队在1997年使用计算机算法发现,与刚性蛋白质相比,内在无序蛋白质往往富含亲水性氨基酸。因此,亲水性和疏水性氨基酸的平衡可以预测给定蛋白质是仅部分折叠还是完全不折叠。
为了探索其早期发现的生物学意义,邓克的团队在2000年对生命王国进行了比较。研究人员使用算法检查了各种生物体的基因组,这些算法寻找编码长链亲水性氨基酸的DNA片段。相应的蛋白质将是最有可能至少部分非结构化的候选者。在最简单的生物体、细菌和古细菌中,预计内在无序的蛋白质较少。但在真核生物——更复杂的生物体,如酵母、果蝇和人类,它们具有有核细胞——非结构化蛋白质似乎更为普遍。
这些结果在2004年得到了伦敦大学学院的大卫·T·琼斯领导的团队的扩展,他们使用了类似的比较,其中包括人类数据。引人注目的是,研究人员发现,多达35%的人类蛋白质可能具有长的非结构化区域。因此,我们蛋白质中约有三分之一可能具有大的区域,锁和钥匙的概念对于这些区域根本不适用。
造成这种差异的原因尚不清楚,但一种可能的解释是,具有锁和钥匙结构特征的蛋白质针对酶活性等功能进行了优化,而非结构化蛋白质最擅长信号传导和调节。简单细菌将所有东西都放在一个容器中;复杂生物体具有多个细胞内容器,如细胞核、高尔基体、线粒体等等,因此需要在其各个部分之间进行更多信号传导,并需要更广泛的调节。多细胞生物还需要信号传导方案来协调各个细胞和组织之间的活动。在前面讨论的p27的例子中,由于其灵活性,该蛋白质可以沿着细胞的信号通路传递化学信息:这些信息编码在其构象、化学修饰(如磷酸化)以及与其结合的伙伴(从而抑制或调节)中。
进化史上保守得最好的秘密
细菌中内在无序蛋白质的缺乏可能意味着这些蛋白质仅在进化后期才出现。然而,几条研究线索表明它们出现得很早。一方面,许多重要的细菌信号传导系统确实使用非结构化而不是结构化蛋白质。此外,在由RNA和蛋白质组装在一起的进化上古老的分子机器中,几乎所有蛋白质在未与其RNA伙伴结合时都是部分或完全非结构化的。这些古老的杂合复合物包括剪接体(一种分子机器,在产生蛋白质的步骤中编辑或剪接RNA)和核糖体(将氨基酸串联成蛋白质的复合物)。
对生命起源的研究也暗示了非结构化蛋白质的古老性。一个主要的假设是,第一个生物体是基于RNA的。RNA既充当催化分子,又充当遗传信息的存储库——这些角色在现代细胞中分别由蛋白质和DNA扮演。“RNA世界”理论的一个重大问题是,RNA非常低效地折叠成其催化活性形式,并且经常卡在非活性构象中。在今天的细胞中,称为RNA伴侣蛋白的蛋白质帮助RNA正确折叠。其他蛋白质将给定的RNA稳定在其活性构象中,这提高了这种蛋白质的出现解决了RNA折叠的粘连问题的可能性。伴侣蛋白和稳定蛋白在与RNA结合之前都缺乏稳定的结构。
对遗传密码起源的分析为非结构化蛋白质的早期进化提供了更多支持。遗传密码是细胞用来将存储在核酸(RNA或DNA)中的信息翻译成氨基酸序列的一组规则。研究人员认为,某些氨基酸在生命进化的早期就被编码了,而其他氨基酸则在稍后出现。驱动蛋白质折叠的体积大、疏水的氨基酸很可能出现得较晚,因此仅由早期氨基酸制成的蛋白质如果单独存在,很可能保持未折叠状态。如果关于遗传密码进化的这些想法是正确的,那么地球上的第一个蛋白质折叠得很差或根本不折叠。后来出现的氨基酸显然使蛋白质能够形成结构,为形成锁和钥匙酶活性位点奠定了基础,并使蛋白质在数百万年的时间里取代RNA成为所有活细胞中的催化动力源。
双刃剑
鉴于蛋白质在生物学中的核心地位,它们中的许多与疾病有关也就不足为奇了。蛋白质内在无序的新范式将深刻影响我们理解和治疗人类疾病的方式。
首先,在某些情况下,蛋白质缺乏结构可能是有害的:如果细胞过量产生它们,某些非结构化蛋白质容易混杂在一起并形成斑块。在大脑中,这种斑块是几种毁灭性神经退行性疾病(包括阿尔茨海默病、帕金森病和亨廷顿病)的主要嫌疑对象。更普遍地说,似乎需要严格控制非结构化蛋白质
以避免麻烦:英国剑桥医学研究委员会分子生物学实验室的M. Madan Babu领导的对酵母、小鼠和人类进行的大规模研究在2008年表明,与折叠蛋白质相比,细胞对无序蛋白质的调节更严格。
认识到内在无序蛋白质可能与某些疾病有关,也正在为潜在的治疗方法带来新思路。蛋白质-蛋白质相互作用是几乎所有生物学过程的基础,因此长期以来一直是药物发现的有吸引力的靶点,但与针对酶与较小分子相互作用的方法相比,迄今为止收效甚微。与非结构化蛋白质相互作用的蛋白质通常为其伙伴提供锚定点,研究人员可能会利用这些锚定点插入新药。特别是,阻断重要的癌症抑制基因与其调节伙伴之一之间相互作用的分子已在实验动物中显示出对抗癌症的成功,目前正在人体临床试验中。克里瓦奇及其同事正在开发类似的攻击路线来治疗视网膜母细胞瘤,这是一种特别影响儿童的眼癌。早期的动物试验已取得令人鼓舞的结果。其他实验室正在进行类似的项目。
对理解蛋白质工作原理感兴趣的科学家们开始消除过去以蛋白质功能的锁和钥匙模型为代表的偏见。他们正在认识到,某些生物学功能最好由刚性蛋白质执行,而另一些功能最好由高度动态的蛋白质执行。蛋白质结构和功能新时代的曙光有可能改变我们对生命的理解——并且可能拯救生命。