从现代化学家的角度来看,我们基因中 DNA 的结构相当平淡。这种分子对生命具有众所周知的重要性,但化学家通常只看到一个均匀的双螺旋结构,它本身几乎没有功能行为。然而,令人惊讶的是,这种分子是一个真正丰富而奇特的研究领域的基础,该领域桥接了合成化学、酶学、结构纳米技术和计算机科学。
利用这项新科学,我们构建了可以在水溶液中运行的分子逻辑门。我们构建这些基于 DNA 的计算模块的目标是开发纳米机器,这些机器可以存在于生物体中,感知条件并根据它们感知到的内容做出决策,然后采取行动,例如释放药物或杀死特定细胞。
我们通过构建可以完美玩井字游戏的自动机,展示了我们 DNA 门的某些能力。人类玩家添加 DNA 链溶液来表示他或她的移动,而 DNA 计算机通过点亮它选择的下一个方格来回应。人类玩家的任何错误都将受到失败的惩罚。虽然玩游戏离我们的最终目标还很遥远,但它很好地检验了基本分子计算模块如何在即插即用模式中轻松组合以执行复杂的功能,就像现代计算机中基于硅的门可以连接起来形成复杂的逻辑电路,从而执行计算机今天为我们所做的一切。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
溶解的医生
1997 年末,我们中的两人(斯托亚诺维奇和斯特凡诺维奇)决定结合我们在化学和计算机科学方面的个人技能,共同开展一个项目。作为来自塞尔维亚贝尔格莱德小学的的朋友,我们碰巧在共进晚餐,并在一些葡萄酒的鼓励下,我们考虑了几个主题,包括生物信息学和使用 DNA 进行计算的各种现有方法。我们决定开发一种新方法,利用分子自行计算和做出决策。
我们计划借鉴电气工程的方法,创建一组分子模块或原语,这些模块或原语将执行基本的计算操作。在电气工程中,计算原语被称为逻辑门,具有直观的名称,例如 AND、OR 和 NOT。这些门接收代表二进制代码 0 和 1 的输入电信号,并执行逻辑运算以产生输出电信号。例如,只有当 AND 门的两个输入均为 1 时,它才会产生输出 1。现代计算机拥有数亿个这样的逻辑门,它们连接成非常复杂的电路,就像用几种乐高积木搭建的精巧结构。同样,我们希望我们的分子模块可以混合在一起,形成越来越复杂的计算设备。
然而,我们的目标不是与基于硅的计算机竞争。相反,由于斯托亚诺维奇刚刚在一家制药公司完成了一段短暂的工作,我们决定开发一个系统,该系统可以用于开发“智能”治疗剂,例如可以感知和分析患者病情并做出适当反应的药物,在注射后无需人工干预。例如,一种这样的智能药物可能会监测血液中的葡萄糖水平,并决定何时释放胰岛素。因此,我们的分子逻辑门必须具有生物相容性。
这样的分子模块可以有无数种功能。例如,在白血病等疾病中,免疫系统中的大量白细胞亚群在其细胞表面显示出特征性标记,这取决于细胞的谱系和发育阶段。目前使用抗体的疗法一次性消灭大量这些亚群,因为它们仅针对一种表面标记。这种不分青红皂白的攻击会通过消灭过多健康细胞来抑制患者的免疫系统,从而导致严重的并发症甚至死亡。能够协同工作以感知和分析多个标记的分子模块——包括执行诸如“标记 A 和 B 或 C 存在,但 D 不存在”之类的逻辑运算——可能能够选择患病且失控生长的特定细胞亚群,然后仅消除这些细胞。
我们模块的另一个应用可能是在 DNA 分析中,寻找大量的可能基因突变或识别各种微生物病原体中的一种。我们最先进的井字游戏自动机结合了 32 种不同的短 DNA 序列(寡核苷酸)。如此多的逻辑门输入可以分析 40 亿种可能的寡核苷酸组合,并将它们划分为数千种模式,每种模式都是某些病原体或基因型的特征。
分子逻辑
早在 1990 年代初期,研究人员就报告了基于合成分子的逻辑门。例如,在 1993 年,贝尔法斯特女王大学的 A. Prasanna de Silva 及其合作者用小的有机分子制成了 AND 门,只有当氢离子(来自酸)和钠离子都与它们结合时,这些分子才会发出荧光。在 1997 年,现任西北大学的 J. Fraser Stoddart 及其同事制造了“异或”(XOR)门,其中分子在存在其中一种输入(在本例中为氢离子和称为胺的分子)时会发出荧光,但两者都存在时则不会。然而,这些例子不具有生物相容性,因为它们需要高浓度的酸和其他会损害活细胞的化合物。
在 1990 年代中期,其他研究人员利用了 DNA 存储信息的能力,信息存储在其碱基序列中——通常缩写为 A、T、G 和 C 的分子,它们配对形成连接著名的双螺旋结构两条链的横档。然而,他们的技术与我们设想的那种系统非常不同,即溶液中漂浮的分子逻辑门将以非常类似于硅逻辑门工作方式的方式处理输入和输出。尽管如此,DNA 显然具有生物相容性计算的巨大潜力,而另外几项进展为我们发明我们自己的 DNA 逻辑门品牌提供了工具。
首先,在 1995 年,加利福尼亚州拉霍亚斯克里普斯研究所的杰拉尔德·F·乔伊斯开发了一种方法,用于生产由单链 DNA 制成的酶,这些酶将其他单链 DNA 片段切割成两段。这些所谓的脱氧核酶有两个短臂,它们仅与另一个具有正确互补碱基序列的 DNA 片段结合,因此它们对它们切割的底物 DNA 链非常特异。
附着在底物链每端的特殊染料分子使实验室工作人员能够监测切割过程。在底物的一端,染料分子是“淬灭剂”,只要链保持完整,淬灭剂就足以有效保持靠近荧光标记染料,从而阻止另一端的荧光标记染料发出荧光。链被切割后,它的两部分分开,标记染料分子可以不受阻碍地发出荧光。随着 DNA 酶的工作进展,切割越来越多的链,溶液逐渐被标记染料的荧光颜色照亮。
另一个关键进展发生在我们的初步计划之后不久,当时耶鲁大学的罗纳德·R·布雷克报告了一种将脱氧核酶与充当识别模块的分子基团整合的方法。这些模块的工作方式类似于传感器,当正确的输入分子与它们结合时,它们会激活或抑制它们附着的 DNA 酶。布雷克甚至在一个结构中组合了两个这样的模块,该结构可以用作具有两个小输入分子的 AND 门。非常有趣的是,他的小组发现天然核糖开关——由细菌用来控制其哪些基因主动产生蛋白质的 RNA 分子——使用了这种双传感器结构 [参见“核糖开关的力量”,作者:Jeffrey E. Barrick 和 Ronald R. Breaker;《大众科学》,2007 年 1 月]。
我们看到我们可以用 DNA 酶构建我们的逻辑门,DNA 酶与旨在识别具有特定碱基序列的短 DNA 链的控制传感器模块集成在一起。因此,DNA 链将充当逻辑门的输入(如果链存在,则输入为 1;如果不存在,则输入为 0),而门的酶将通过切割溶液中的其他 DNA 链来输出“1”。由于 DNA 同时充当输入和输出,因此原则上可以将我们的门链接在一起以形成复杂的电路。就像电路中的导线一样,传感器和酶的碱基序列将控制哪些门的输出“连接”到哪些输入,即使所有门都在试管中独立晃动。
在使用其他设计进行了一些不太成功的尝试之后,我们最终确定使用称为茎环的 DNA 结构作为我们的识别模块。新泽西州纽瓦克公共卫生研究所的 Sanjay Tyagi 和 Fred Kramer 报告说,茎环在两种形状或构象之间切换。在闭合构象中,构成茎环的 DNA 链自身折叠,两端拉在一起,形成茎以及未拉链的 DNA 环,就像棒棒糖的轮廓。由与环互补的碱基序列组成的输入 DNA 链将与之结合,但在形成熟悉的双螺旋时,它会撬开茎——双螺旋 DNA 无法形成足够紧的曲线来维持闭合环。
根据我们如何将茎环连接到 DNA 酶,打开环可能会激活或抑制酶的活性。如果酶的两个底物匹配臂之一充当茎的一侧,则闭合的茎将阻止酶的活性。我们将这种结构称为传感器或 YES 门,因为添加茎环控制器的输入链(例如,“输入 X”)会打开茎,暴露酶的底物匹配区域并使其发挥作用。酶的输出(特定切割的 DNA 链)实际上是说:“是,输入 X 存在。”
在酶的另一个臂上添加第二个具有不同环序列 (Y) 的茎环会产生 AND 门。只有当输入 X 和输入 Y 都与之结合时,酶才能发挥作用并切割 DNA。
我们通过将茎环序列插入酶的“背面”来制造抑制性控制器——当正确的输入与环结合时,它将使酶失活。现在,当茎闭合时,酶是完整的并产生输出。相关的输入链将打开茎环并使酶变形到足以使其失活的程度。当然,这种失活不会移除门已产生的输出链,因此单独来看,此 NOT 门的功能不如电子 NOT 门方便。但是,当 NOT 单元与 AND 门结构结合使用时,它会发挥自己的作用。由此产生的门,我们称之为 AND-AND-NOT,仅当输入 X AND Y AND NOT Z 存在时才产生输出。该功能也称为 INHIBIT 门,事实证明它对我们的井字游戏自动机非常有用。
我们系统中最重要的方面是它具有高度模块化。我们可以为输入使用数百个甚至理论上数百万个不同的碱基序列,我们也可以更改输出链的序列。我们甚至可以将底层酶切换为连接酶,连接酶将短链连接在一起以产生更长的链。事实上,德克萨斯大学奥斯汀分校的 Andrew D. Ellington 小组广泛研究了基于连接酶的开关。
门的功能也是自主的。也就是说,一旦我们通过将输入添加到溶液中来触发计算,就不再需要人工干预。本质上,DNA 分子根据它们接收到的任何输入自行做出决策。
然而,我们的门与电路中基于硅的逻辑门确实存在一些显着差异。首先,我们无法重置我们的门。一旦输入链与茎环控制器结合,它往往会在计算的其余时间内保持在那里。切割的寡核苷酸输出链也无法重新组装。我们的最终生物医学目标不需要门重置功能,但这对于潜在的分子机器人应用(涉及移动部件)将非常有用。我们正在探索使用连接酶重新组装输出链。
其次,电子门具有阈值电压,在其阈值电压下会发生切换,并且它们的输出与特定电压相关联,因此它们不会停留在中间电压。因此,0 和 1 定义明确,逻辑是真正的数字逻辑。相比之下,我们的门溶液在非活动形式和完全活动形式之间连续变化,具体取决于我们添加到流体中的输入量。如果我们试图构建个人计算机的分子等效物,这种行为将很重要,但对于许多生物医学应用来说,这并不重要。
DNA 玩井字游戏
有了构建分子逻辑门的一般方法,我们寻找了一个客观的测试来检验它们的计算能力。我们希望将我们的逻辑门应用于每个人都会立即看到分子正在做出决策的情况。新计算机系统的传统测试是使其玩策略游戏。游戏的规则提供了具有直接成功衡量标准的挑战:系统要么能够玩游戏,要么不能。游戏能力与一般计算能力密切相关。
我们选择了经典的儿童游戏井字游戏作为我们的演示。在这个在 3 x 3 网格上进行的游戏中,两名玩家尝试将三个标记排成一行,同时阻止对手这样做。井字游戏是最简单的完全信息双人游戏之一,这意味着玩家在每一步都了解有关游戏状态的所有信息(例如,与大多数纸牌游戏不同,在纸牌游戏中,对手的牌是未知的)。如果双方都打得好,井字游戏将始终以平局结束,但我们的设备将利用对手犯下的任何错误。
游戏足够简单,我们可以将所有决策制定编码到仅检查对手移动的逻辑运算中。也就是说,当您使用固定策略时,即使您只记得对手的移动,您也可以计算出您过去的移动是什么,因此当前的棋盘位置是什么,以及您的策略指示的下一步移动是什么。我们将推理链浓缩为一个逻辑门网络,该网络将对手的移动作为输入,并将您的下一步移动作为输出。2002 年,我们开始构建这样一个由 DNA 逻辑门组成的网络,一个井字游戏自动机,我们将其命名为 MAYA(molecular array of YES and AND-AND-NOT gates,YES 和 AND-AND-NOT 门分子阵列)。
MAYA 由九个井组成,对应于井字游戏的方格。每个井都包含其自身精确定义的溶液中的 DNA 逻辑门组。这些门的酶都设计用于切割相同的底物 DNA 链,该底物 DNA 链也位于所有井中,但它们需要镁离子才能发挥作用。因此,添加镁离子会使 MAYA 开始运行。由于中心井中的酶上没有茎环控制器,因此它们立即开始切割底物。来自中心井的荧光增强,表明 MAYA 已将中心方格作为开局。
人类(我们称他为哈利)有八个输入链(每个剩余的方格一个)用于输入他的移动。这些链的碱基序列与控制 MAYA DNA 门的茎环上的序列互补。例如,要移动到方格 4,哈利将输入 4 添加到 MAYA 的所有九个井中。MAYA 通过打开另一个井中的荧光来发出其移动响应信号。
随着游戏的进行,每个井都包含代表哈利所有移动的输入链,并且每个井中的门组合都会处理这些输入。在每次移动之后,其中一个井包含一个门,该门由最后一个输入与之前的输入组合触发。该井亮起以指示 MAYA 的移动。
为了简化 MAYA 的编程,我们将哈利的第一步限制为左上角(方格 1)或左侧(方格 4)。这两个移动代表哈利可能做出的所有移动,以响应 MAYA 在中心开局,因为棋盘是对称的。如果他移动到其他地方,则可以旋转棋盘使其成为方格 1 或方格 4 中的移动。有了这个限制,我们为 MAYA 选择的策略允许进行 19 种不同的可能游戏。在其中一场游戏中,哈利完美地发挥,游戏以平局结束。在剩下的 18 场游戏中,MAYA 利用了他的错误并获胜。
为了计算出自动机所需的所有门,我们考虑了所有 19 场游戏中的每一步移动,并确定了哪些门会产生所需的移动。最困难的部分是将策略要求与我们的逻辑门技术相匹配。虽然我们的门设计为输出 DNA 链,原则上可以用作其他门的输入,但对于 MAYA,我们选择避免依赖该功能及其可能产生的额外复杂性。总共,我们花费了不到三个月的时间来设计和开发 MAYA,并在实验室中全面测试了所有 19 场游戏。
MAYA-II
不满足于 MAYA 的局限性,我们构建了一个不受限制的版本 MAYA-II。我们还使 MAYA-II 更加用户友好,以两种不同的荧光颜色显示两位玩家的移动。自动机仍然先走并占据中间方格,但人类哈利随后可以占据任何剩余的八个方格。MAYA-II 玩的游戏数量是 MAYA 的四倍,其中 72 场获胜,4 场平局。
我们编写了一个计算机程序(用于标准的基于硅的计算机)来确定逻辑门的适当排列。由此产生的设计需要 128 个不同的逻辑门,其中 96 个用于决定和发出自动机的移动信号(使用红色荧光),32 个用于突出显示哈利的移动(使用绿色荧光)。
这个自动机的庞大规模使得构建和测试 MAYA-II 成为一项巨大的挑战。我们中的一人(麦克唐纳)领导了这个项目,并培训了几名高中生来测试自动机,主要是在夏季和星期六。学生们多次检查了所有 76 场游戏。他们不得不更改 MAYA-II 的设计以解决几个问题(然后在每次调整后重新检查所有游戏)。
我们进入该项目时最主要担心的是某些序列可能会在意外的位置结合。我们的计算机建模工具不够先进,无法预测此类困难。事实上,虚假结合相对罕见。相反,更严重的问题是单个门以不同的速率切割它们的底物。我们(或者更确切地说,我们的学生)不得不调整浓度和结构来纠正这种可变性。我们还很快发现,某些门在混合物中的作用与它们单独作用时不同,因此需要进行其他重新设计。最后,经过连续三个夏季和许多个星期六,通过一些输入更改和对门序列和浓度的许多小调整,我们的团队拥有了一个系统,在该系统中,我们可以在所有游戏中,在所有井中,可重复地清楚地区分活动门和非活动门。
意义
在一个系统中集成 100 多个分子逻辑组件代表着一个重要的里程碑。用电子学的术语来说,MAYA-II 是第一个“中等规模集成分子电路”。我们对如此复杂的设备所做的工作使我们能够将我们的脱氧核酶逻辑门改进为即插即用计算原语。我们实验室的新工作现在使用现有组件进行得更顺利,我们可以设计通常可以立即工作的门,而无需进行任何微调。
我们可以将我们的方法与其他最近开发的分子计算方法相结合。例如,加州理工学院的埃里克·温弗里小组提出了令人印象深刻的“链置换级联”,可用于以类似的方式分析寡核苷酸混合物。在该方案中,DNA 链结合、连接和置换,主要无需任何类似于我们门的 DNA 酶的催化剂。温弗里的系统已经用五个单元的级联进行了演示。相比之下,如果组合三层门,我们目前的系统会变得非常缓慢。MAYA-II 虽然非常复杂,但作为一个单层门运行,并且大约需要 15 分钟才能执行一次移动。
对于我们的决策分子,我们现在非常有信心将许多门组合在一起,代表着全新挑战的任务正在召唤我们。我们希望有一天能够报告一种分子混合物,可以通过与它们玩示例游戏或通过引入某种选择来消除编码失败策略的门来教会它们策略。然后,我们可以开发可以训练来识别癌细胞的自动机。
但也许我们计划中最重要的下一步是结合新的原语来执行更多功能,例如传感和移动(或“驱动”)。这些是自动机,它们将根据给定输入的存在而采取行动。我们的即插即用系统届时将远远超出“娱乐”范围,并将为一些真正的工作做好准备。
注意:本文最初以标题“用于工作和娱乐的 DNA 计算机”印刷。