蛋白质是生命的基本纳米机器,它为像我这样的科学家创造纳米机器提供了许多经验教训。蛋白质是含有数百到数千个原子的大分子,通常跨度为几纳米(十亿分之一米)到几十纳米。我们的身体包含至少 20,000 种不同的蛋白质,它们的功能包括使我们的肌肉收缩、消化食物、构建骨骼、感知环境以及不知疲倦地回收细胞内数百个小分子。
1986 年,当我还是化学本科生时,我梦想着设计和合成能够完成蛋白质所做的惊人事情甚至更多事情的大分子(含有 100 多个原子的分子)的可能性。自 20 世纪 70 年代末第一批 TRS-80 计算机问世以来,我就一直在编写计算机程序,我认为如果我能像编写软件一样轻松地构建复杂的分子机器,那将是一件很棒的事情。我想为物质创造一种编程语言——软件和化学的结合,使人们能够描述纳米机器的形状,然后确定化学家或机器人应执行以构建纳米器件的一系列化学过程。
不幸的是,通过设计新蛋白质来发明纳米机器的想法遇到了一个严重的障碍。每种蛋白质通常都从一个简单的线性链开始,该线性链由从仅 20 种氨基酸的库中提取的特定氨基酸序列组装而成。到目前为止,一切都很好,但是蛋白质的特性以及它可以执行的功能取决于其形状。在细胞中组装氨基酸链后不久,它会通过称为蛋白质折叠的复杂过程,坍缩成螺旋和其他结构的复杂缠结。氨基酸序列决定了最终形状,但是预测特定序列将呈现什么形状是科学和工程领域最重大的未解决挑战之一(蛋白质折叠问题)。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
在我第一次产生对未来的憧憬大约 20 年后,我的实验室最终开发出了一种生产具有可编程形状的大分子以及设计它们所需的计算机软件的方法。我们的方法受到天然蛋白质模块化的启发,但它不依赖于氨基酸链自发坍缩成形状——因此它避免了与未解决的折叠问题作斗争。
我们正在开发这项技术来创造可以执行特定功能的分子。我们的最初目标之一是创造传感器:当它们与特定的目标分子(例如葡萄糖、毒素或化学战剂)结合时,会改变形状和颜色的大分子。结合事件触发传感器分子将两个荧光基团摆动在一起,从而改变其颜色,从而发出样品中存在目标的信号。我们还在使用我们的技术来创造长的、铰接的分子,这些分子响应外部信号(分子执行器、分子阀门和计算机存储器的创造步骤)而打开和关闭。
我们设想我们的技术最终将导致一种更先进的构建纳米机器的方法:我们将使用它来制造复杂的纳米工具,例如装配器,它像核糖体一样负责构建细胞内的蛋白质,将在外部程序员的控制下组装其他纳米机器。目前,第二个梦想仍存在于未来。
从自然中汲取教训
1990 年我完成本科学习时,我认为开发纳米机器的途径在于推导出蛋白质折叠的规则,并使用这些规则来开发新蛋白质。我加入了加州大学旧金山分校罗伯特·M·斯特劳德及其蛋白质晶体学小组。蛋白质晶体学家培养蛋白质晶体,并使用 X 射线来确定蛋白质原子的精确三维排列。使用这种工具,我对蛋白质结构的复杂性和美感有了深刻的认识。我花了四年时间创造了 4HB1,一种我自己设计的人工蛋白质。我首先组装了一个人工基因,然后将其插入细菌中,细菌表达了它——也就是说,制造了基因 DNA 编码的蛋白质。接下来,我结晶了所得蛋白质并确定了其 X 射线晶体结构。令人兴奋的是,我发现 4HB1 具有我设计的构象!
然而,经过所有这些工作,4HB1 只是一个分子门挡。除了作为一种良好折叠的人工蛋白质存在之外,它什么也没做。最令人不安的是,这次经历并没有揭示我创造所需形状的其他蛋白质所需的简单规则。相反,蛋白质折叠的复杂性表明,这种简单的规则可能不存在。在 1997 年完成我的博士学位时,我得出结论,创造定制设计的纳米机器的更好方法是从一组有限的模块化构建模块中构建它们,这些模块不会通过蛋白质的折叠过程获得其形状。
这不是一个新想法。1995 年,德克萨斯大学奥斯汀分校的布伦特·艾弗森开发了可以链接成称为寡聚物的短聚合物的构建模块。然后,这些寡聚物会自组装成褶皱结构,因为富电子供体基团会拉动结构中的缺电子受体基团。
大约在同一时间,威斯康星大学麦迪逊分校的萨姆·盖尔曼和苏黎世瑞士联邦理工学院的迪特·塞巴赫正在开发称为 β-肽的合成分子,β-肽是 β-氨基酸的柔性链——β-氨基酸是大多数非天然存在的分子,其一般结构与常规氨基酸(α-氨基酸)略有不同。盖尔曼和塞巴赫的短 β-肽折叠成扭曲的螺旋。
这些构建具有特定形状的大分子的新方法令人鼓舞,但它们似乎用另一个折叠问题换取了一个折叠问题。困难在于,天然蛋白质和这些新分子涉及由单键连接的分子链,这些单键使结构在其整个长度上具有很大的弯曲自由度。这些分子之一在获得最终形状时如何弯曲取决于当沿着链条的所有不同构建模块靠得更近时产生的吸引力和排斥力的复杂相互作用。
我心中有一个更激进的方法。我想完全消除通常的折叠过程,从而更好地控制最终产品的形状。为了实现这个目标,我着手发明刚性构建模块,这些模块可以通过成对的键相互连接,以创建刚性的、梯子状的大分子。这个想法以前有人尝试过:1987 年,当时在英国谢菲尔德大学的 J·弗雷泽·斯托达特通过从构建模块创建分子带和项圈,引入了分子乐高积木的概念。
我加入了哈佛大学格雷戈里·维尔丁的实验室,学习合成有机化学。在合成非天然氨基酸和寻找实现我更大愿景的途径的两年里,我偶然发现了一篇描述一种名为二酮哌嗪的化学结构的论文。在这种结构中,六个原子连接成一个包含两个酰胺键的环[参见下一页的方框]。酰胺键是将蛋白质组成氨基酸连接在一起形成链的键,就像一排人手牵着手一样。当两个氨基酸像两个人面对面并牵着双手时,它们的胳膊形成一个闭环时,就会出现二酮哌嗪。合成蛋白质的化学家已经开发出许多优异的氨基酸之间形成酰胺键的反应,他们都非常熟悉二酮哌嗪结构,因为它会在不需要时形成并干扰他们合成蛋白质的努力。不过,我认为我可以利用二酮哌嗪的形成来连接我的构建模块。
这个想法的其余部分很快就到位了。在人的类比中,氨基酸的两条臂是仅由几个原子组成的基团,称为胺基和羧基。(然而,与手臂不同,这些基团实际上并没有伸出很远。)将一个视为左臂,另一个视为右臂,酰胺键是左手握住右手。我的每个新构建模块或单体都像两个人刚性地捆绑在一起(例如,背靠背),他们的手臂放在他们面前。一个单体将通过一个人握住另一个人的双手与序列中的下一个单体连接——形成一个二酮哌嗪环。
在真实的化学术语中,每个单体将由一个主要由碳原子组成的刚性分子组成,其中集成了两个氨基酸基团,并且两个氨基酸的胺和羧基都可用于与其他单体结合。两个单体将通过每个单体上的氨基酸基团反应在一起形成二酮哌嗪环而连接。我们将把这种单体称为双氨基酸(双表示两次),因为每个单体都包含两个氨基酸。正如氨基酸链被称为肽一样,我们将把我们的双氨基酸链称为双肽。
从头开始
有了构建模块集合的蓝图,我在匹兹堡大学建立了一个新实验室,我的学生和我可以在那里开发合成化学来使这个想法奏效。在两年内,我的第一批研究生之一克里斯托弗·莱文斯合成了我们的第一个双氨基酸。他从羟脯氨酸开始,羟脯氨酸是胶原蛋白(使软骨、韧带和肌腱强壮的蛋白质)的商业上可获得的成分,另一个小组以前曾将其用于制造非常像我们单体设计的分子。莱文斯使用我们共同制定的九步配方,将羟脯氨酸转化为四种构建模块,我们将其命名为 pro4(2S4S)、pro4(2S4R)、pro4(2R4S) 和 pro4(2R4R)。我们称它们为 pro4,因为它们都类似于氨基酸脯氨酸,并在碳 4 上安装了一个额外的氨基酸(化学家通过以系统的方式用数字标记有机分子中的碳原子来识别它们)。标签 S 和 R 表示连接到碳 2 和碳 4 的基团的取向。完成的构建模块是干燥的粉末,在室温下可稳定储存数月。
我们构建我们的单体构建模块,其中胺上附着保护基团(以防止酰胺键在我们需要它们之前形成),并且其中一个羧基以改性的、反应性较低的形式称为酯。为了合成双肽,我们以单键将构建模块按所需顺序组装起来,然后连接所有第二键,使分子刚化成最终形状[参见对面页面的方框]。莱文斯执行了这个由两部分组成的过程,以构建我们第一个由 pro4 单体组成的短结构。
连接过程的第一部分使用一种称为固相支持合成的技术。它从涂有胺基的塑料珠开始。第一个构建模块上的羧基与胺之一形成酰胺键,将构建模块固定到珠子上。使用过量的构建模块可确保珠子上的几乎所有胺都附着了一个构建模块。用溶剂快速洗涤可去除副产物和剩余的构建模块。然后用碱洗涤去除新添加的构建模块上的两个胺之一上的保护基团(两个胺具有不同的保护基团,因此仅剥离其中一个)。添加第二个构建模块,并通过其羧基和暴露的胺基与第一个构建模块连接。然后从其胺之一中去除保护,添加第三个构建模块,依此类推。
这种构建过程进行得很慢:添加每个连续的单体大约需要一个小时,因为我们必须等待足够长的时间,以便几乎所有暴露的胺都获得它们的构建模块。幸运的是,通常用于合成肽的机器人可以自动化这项工作,并且可以轻松地并行构建许多序列。
当链完成时,我们使用强酸去除珠子,然后从链中每个构建模块中剥离第二个胺保护基团。添加碱溶液会导致每个构建模块上新暴露的胺攻击前一个构建模块上的酯,并形成另一个酰胺键。由于两个酰胺键连接每对相邻的构建模块,因此整个分子现在是刚性的,并且具有可预测的、明确定义的形状。
我们很快发现双肽可溶于水和其他极性有机溶剂(易于与水混合的溶剂)。双肽的水溶性使其易于研究,并表明我们可以使用它们来开发必须能够分散在血液中的新药。
编程形状
构成我们双肽的双氨基酸像形状奇特的乐高积木一样连接在一起。特别是,每个双氨基酸的行为都像一块砖块,其顶面上的凸起相对于其底面上的孔是倾斜和扭曲的。重复将一种类型的砖块堆叠在自身之上,您可以制作一个弯曲的形状,曲线的具体形状取决于选择哪种双氨基酸。仅使用两种不同类型的砖块以不同的顺序堆叠,您可以制作 2N 种不同的形状(N 是堆叠中砖块的数量)。一个由我们的四种 pro4 双氨基酸制成的 10 个嵌段长的双肽可以具有大约一百万种 (410) 形状中的任何一种。我们拥有的构建模块形状越多,我们就越能更好地控制大分子的最终形状。然后,挑战在于设计和合成那些具有有用功能的序列。
设计具有特定形状的双肽的关键是了解我们的各个双氨基酸在相互连接时呈现的精确形状。这些信息,类似于了解每块砖块的大小及其凸起的倾斜度和扭曲度,将成为我们物质编程语言的基础。在合成了我们的第一个双肽后,我们就可以进行测量以确定它们的碎片如何组合在一起。
我们进行了核磁共振实验,以找出双肽上的哪些氢原子彼此靠近,并应用其他技术来测量碳-氢键的取向。从这些测量结果中,我们推断出我们需要的形状信息,并使用它创建了一个用于构建双肽的计算机辅助设计程序,称为 CANDO(computer-aided nanostructure design and optimization 的缩写)。
格雷戈里·伯德,我实验室的另一位研究生,使用 CANDO 设计了分子棒和弯曲结构。最近,他组装了这些结构,在每个序列的每一端附着一个称为自旋探针的化学基团,以验证反应容器中的结果与计算机中的设计是否匹配。事实上,pro4(2S4S) 和 pro4(2R4R) 构建模块的序列具有 C 形和 S 形,正如 CANDO 预测的那样。
pro4 组双氨基酸就像倾斜度相对较小的乐高积木,因此我们可以使用它们来制作棒状和轻微弯曲的形状,这些形状可以像支柱一样将化学基团以特定的距离隔开。然而,蛋白质的许多有用功能是由于可以用于将蛋白质与特定靶标结合或容纳分子并催化反应的腔体而产生的。为了创造具有合适腔体的紧凑型双肽,我们需要扩大我们的构建模块库。我的学生斯蒂芬·哈贝朝着这个目标迈出了第一步,他开发了一种我们称之为 hin 的双氨基酸,它在双肽中创造了一个急转弯。
我们的单体集合逐年增长,CANDO 分析表明,我们目前的 14 个单体的库足以创造包含腔体的紧凑型双肽。但是,随着我们开发新的构建模块并将它们纳入双肽中,我们遇到了一个问题。形成刚化第二酰胺键的反应在 pro4 单体之间非常迅速,但对于我们所有的新构建模块来说都很缓慢。提高反应温度加快了速度,但打乱了最终形状。这个问题是创造更大更复杂的双肽的巨大障碍。
我的学生沙拉德·古普塔通过开发一种关闭第二酰胺键的新方法部分克服了这一挑战。在每个单体上,他将酯改为更易受胺攻击的酯,并且受到 20 世纪 70 年代一篇论文的启发,他使用了乙酸作为催化剂而不是碱。热和酸的结合加速了环闭合反应,而不会像热和碱那样打乱我们的双肽形状。
我们花了六个月的时间才找到我们目前确定的酯、保护基团、溶剂和温度的组合,但我们将来会回到这个问题,因为我们的解决方案对于长度超过约五个单体的序列效果不佳。与此同时,我们专注于开发一些我们可以高效生产的双肽的应用——任何长度的仅涉及 pro4 单体的双肽,以及最多包含其他单体的五个单体的序列。
开发应用
我们为双肽追求的首批应用之一是一种可以与霍乱毒素蛋白 (Ctx) 紧密结合的大分子。该蛋白质具有五个相同的口袋,每个口袋都位于五边形的角上。这些口袋使 Ctx 能够与糖 GM1 结合,GM1 恰好适合这些口袋。排列在小肠内壁的上皮细胞表面附着有 GM1 分子,当 Ctx 与这些分子中的五个结合时,它会引发导致危及生命的腹泻疾病的一系列事件。与 Ctx 上这些口袋紧密结合的分子可以阻止毒素与人体细胞结合,并阻止疾病的发生。
其他研究人员已经开发出可以单独与这些口袋结合的小糖。但是这些药物效果不佳,因为它们与 Ctx 的结合不够紧密,并且无法与 Ctx 与人体细胞上的 GM1 产生的五种同步相互作用竞争。我们想知道我们是否可以合成一种双肽,它可以同时将糖插入两个口袋中。我们几乎可以在双肽的末端附着任何我们想要的东西,因此对于此应用,我们在棒状双肽的每一端都放置了一个小糖,该双肽恰好跨越 Ctx 蛋白中相邻口袋之间的距离。实验表明,带有两个糖的双肽比单个小糖与 Ctx 结合得更紧密,并且它们至少与天然 GM1 靶标结合得一样好。
然而,我们一直无法确定每个双肽是与一个 Ctx 的两个口袋结合,还是与两个不同 Ctx 分子上的口袋结合,从而创建一个 Ctx 分子的交联网络。交联 Ctx 不是对抗霍乱的有效方法,因为它仅对体内已经有很多 Ctx(可能是致命量)的人有效。(如果 Ctx 浓度太低,则每个双肽可能与一个 Ctx 上的一个口袋结合,但随后遇到另一个 Ctx 以创建交联的机会太小。)但是交联病毒表面的蛋白质可能有效,因此我们现在正在将这种方法应用于抑制病毒,包括 HIV 和埃博拉病毒。
除了将基团附着到刚性棒的末端外,我们还开发了分子执行器,其中两个棒由铰链连接。执行器是一种通过产生运动来响应信号的设备。我们的棒-铰链-棒执行器设计为通常打开,并在棒外端的基团结合金属或小分子时折叠或关闭。我的学生劳拉·贝拉斯科制作了我们的第一个版本,其中棒长四个构建模块,铰链是一个普通的氨基酸,金属触发打开和关闭。一种应用将是分子阀门[参见对面页面的方框]。阀门将由一个纳米孔组成,其边缘周围附有铰接棒。伸出的棒将阻塞孔;折叠后,它们将打开孔。这些阀门可用于制造一种设备,该设备可以感知患者的病情并释放适当的药物作为响应。
打开和关闭的控制可以通过电子方式进行,方法是在棒的末端放置基团,这些基团会在存在正确电荷时结合。如果可以以这种方式单独控制铰接棒,则可以由铰接棒森林制成计算机存储设备。原子力显微镜尖端将扫描森林的行,检测哪些棒直立作为 1 和 0,类似于检测 IBM Millipede 驱动器的凹坑或无凹坑。擦除凹坑对于 Millipede 系统来说很困难,但对于铰接棒来说,只需反转铰接棒的状态即可。
生物体用来构建蛋白质的 20 种氨基酸的侧链上装饰有各种化学基团。蛋白质将这些化学基团定位在构型中,其形状和其他特性用于催化反应、结合小分子并执行其许多功能。同样,在我们的实验室中,我们正在开发带有附加化学基团的构建模块,这将使我们能够创建在其梯子状骨架上显示化学基团的双肽。到目前为止,我们已经制造了第一个带有侧基的此类构建模块。如果我们能够制造具有化学基团星座的大分子,这些大分子可以模拟酶的活性位点——催化发生的区域——我们可以使用它们来学习如何创造设计酶。
我设想在 20 年后,将会有一个活跃的开发者社区:数十个小组发明基于设计双肽的大分子,并学习如何生产人工酶和其他有用的分子装置。目前,一些有希望的抗癌药物,如哈利克隆菌素-B 和苔藓抑素,合成成本非常高昂。生产这些化合物的稀有海绵和海洋生物无法提供广泛使用所需的数量。20 年后,我们或许能够创造出人工酶,以环境友好的方式高效合成这些化合物和其他有价值的化合物。想象一下,在装满高果糖玉米糖浆的桶中滴一滴人工酶,几天后收获数加仑的苔藓抑素。
如果我们能够开发出能够将植物纤维素分解为乙醇或利用光能将水和二氧化碳结合起来产生乙醇的人工酶,那么这项事业将为社会带来巨大的好处。我们甚至可以设计人工酶来合成我们的双氨基酸构建模块并将它们连接在一起,从而更容易制造双肽。
我们开发了一种化学和软件的组合,用于创造具有可编程形状的大分子。由于生产双肽仅需几天时间,因此我们可以在几周的时间尺度内设计和组装它们、测试它们的特性并塑造下一代。未来几年引人入胜的挑战将是如何从一个功能开始,并设计出最适合执行该功能的双肽序列。
作者
克里斯蒂安·E·沙夫梅斯特是天普大学的化学副教授,他在那里开发形状可编程分子。他于 1997 年在加州大学旧金山分校获得生物物理学博士学位。作为哈佛大学的博士后研究员,他开发了一种使肽更耐蛋白酶的新方法,使其更适合作为潜在药物。他是为加利福尼亚州帕洛阿尔托市远见纳米技术研究所编写生产性纳米系统技术路线图的工作组成员。