尽管“基因工程”这个术语已经使用了至少三十年,重组 DNA 技术现在已成为现代研究的主要手段,但大多数生物技术专家对生物体的工作与工程学几乎没有共同之处。原因之一是,用于构建生物部件的工具尚未达到其他工程领域那样的标准化和实用性水平。另一个原因与生物学的方法和思维模式有关,尽管这些也可能受到技术的有力影响。
例如,电子工程从 1957 年开始转型,当时仙童半导体公司(一家位于后来被称为硅谷的小公司)的 Jean Hoerni 发明了平面技术。这是一种使用称为光掩模的模板在硅晶片内分层和蚀刻金属和化学品的系统。这种新方法使工程师能够清洁且一致地生产集成电路,并通过仅更改光掩模上的图案来创建各种电路类型。不久之后,工程师就可以从其他人制作的简单电路库中提取,并将它们组合成应用范围越来越广的日益复杂的设计。
在此之前,制造电子电路的标准做法是将各个晶体管逐个连接起来。这是一个手工过程,结果参差不齐,是新兴电子行业公认的瓶颈。相比之下,平面技术不断改进,以摩尔定律闻名的速度实现了惊人的进步。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
这种用于设计和制造半导体芯片的技术和方法——芯片工厂——构成了有史以来最成功的工程范例之一,并且是另一个新兴技术领域——生物系统制造——的宝贵模型。
实际上,今天的基因工程师仍然在手工布线每个电路。正如我们在麻省理工学院人工智能实验室的同事 Tom Knight 所观察到的那样,“DNA 序列组装技术缺乏标准化,迫使每个 DNA 组装反应既是解决当前研究课题的实验工具,也是实验本身。”
生物工程中方法和组件的标准化可以催生兼容部件的设计库,并使制造外包成为可能。概念和制造的分离将使生物工程师能够想象日益复杂的设备,并使用强大的工程工具(例如计算机辅助设计)来管理这种复杂性。为了实现这些目标,我们小组的成员已开始识别和开发可能成为生物工厂基础的设备和技术。我们也在努力鼓励一个将工程学的最佳原理和实践应用于生物技术的社区。
优质部件
如果说单个晶体管是电子电路的基本组件,那么它们的生物学等价物就是基因:DNA 的长而有序的片段。因此,为了构建用于高级生物设备的基因电路,我们需要一种以合理的价格快速、可靠地制造长 DNA 片段的方法。
二十年前,科罗拉多大学博尔德分校的 Marvin H. Caruthers 在他人早期工作的基础上,开发了一种利用 DNA 天然化学性质合成单链 DNA 的系统。DNA 由核苷酸组成,核苷酸根据其包含的亚基类型(称为碱基)来区分:腺嘌呤 (A)、胞嘧啶 (C)、鸟嘌呤 (G) 或胸腺嘧啶 (T)。碱基之间的亲和力使它们彼此配对——A 与 T 配对,C 与 G 配对——形成梯状双链 DNA 分子的横档。化学基团在碱基对之间以及沿任一链的相邻核苷酸之间形成键。
Caruthers 的方法,称为固相亚磷酰胺化学,仍然是大多数商业 DNA 合成的基础。它从附着在固体支持物(如聚苯乙烯珠)上的单个核苷酸开始,悬浮在液体中。当暴露于酸时,核苷酸的碱基变得可以与添加到溶液中的新核苷酸形成键。然后将第二个核苷酸暴露于酸,并将另一个核苷酸连接到它,从而有助于链的生长。重复此循环使得合成任何所需的核苷酸序列成为可能,错误率约为每 100 个碱基中有一个碱基。
不幸的是,生物工程师希望构建的许多基因构建体的长度远远超过这个长度。一个简单的基因网络可能有数千个碱基长;即使是细菌这样的小型生物的基因组也可能达到数百万个碱基。因此,我们中一些致力于寻找具有更高产量和更低错误率的合成方法的人将目光投向了自然界以寻找线索。
在活生物体中,由聚合酶等酶组成的生物机器能够以每秒高达 500 个碱基的速度制造和修复 DNA 分子,错误率约为每十亿个碱基中有一个碱基。与最好的 DNA 合成机相比,这代表了产量吞吐量(输出除以错误率)提高了万亿倍,后者每 300 秒添加一个碱基。此外,当复制长 DNA 片段(如细菌基因组)时,多个聚合酶并行工作,因此它们能够在 20 分钟内生产约 500 万个碱基。
我们中的一位(Church)着手通过改造现有的微阵列技术来模仿这种并行性。这些是大的载玻片,上面点缀着短的单链 DNA 片段,称为寡核苷酸或寡核苷酸,长度约为 50 到 70 个碱基。它们使用亚磷酰胺化学在微阵列表面上同时制造,以接近每平方厘米一百万个点的密度锚定在网格图案中。在传统技术的基础上,我们添加了可切割的连接臂,可以从微阵列中释放特定的寡核苷酸。我们的实验微阵列中的每个点大约 30 微米宽,包含大约 1000 万个寡核苷酸分子。
我们将这些链称为构建寡核苷酸,因为它们被设计为在序列中彼此重叠,以便以后可以组装起来形成更长的 DNA 构建体,例如整个基因。但是,任何包含序列错误的寡核苷酸都必须被剔除。为此,我们研究了两种不同的纠错系统。
第一种方法使用相同的微阵列合成方法来生产我们称之为选择寡核苷酸的东西,其序列与构建寡核苷酸互补。然后,我们从载玻片上释放选择寡核苷酸,并用它们冲洗构建寡核苷酸阵列。选择寡核苷酸将遵循碱基配对规则并与其互补的构建寡核苷酸结合或杂交,以形成双链 DNA。然后,我们可以将任何不匹配的构建寡核苷酸链或结合对中的严重缺陷识别为包含错误,并从阵列中释放坏的寡核苷酸。有趣的是,尽管选择寡核苷酸也很可能带有一些错误——以与构建寡核苷酸相同的方式制成——但任一组中错误序列找到完美互补的可能性非常低。因此,使用一组寡核苷酸来校对另一组是一种有效的方法,使我们能够创建平均每 1,300 个碱基中只有一个错误的寡核苷酸。
正如人们可能预料的那样,生物系统对准确复制自身感兴趣,我们的第二种纠错方法直接借用自自然界。我们中的一位(Modrich)在 10 年前首次研究了该过程的细节,并将其称为 MutS、L、H。当两条 DNA 链杂交但它们的 A-T 和 C-G 碱基配对不完美时,双链分子在错配位置不会呈现螺旋形状。MutS 是一种天然存在的蛋白质,可识别并结合此类缺陷,并最终招募其他蛋白质 MutL 和 MutH 来纠正错误。我们中的一位(Jacobson)与麻省理工学院的 Peter Carr 一起使用该系统实现了合成 DNA 每 10,000 个碱基中只有一个碱基的错误率,这足以产生小的基因网络。
这些技术——可释放的并行合成和纠错——使我们能够比迄今为止更快、更经济地组装长而相对无错误的 DNA 构建体。因此,它们可以构成生物工厂的基础,并且很像半导体芯片光刻技术,预计这些工艺会随着时间的推移不断改进。这使我们可以思考我们将在工厂中构建什么。
修订和改进的自然
我们最早的目标之一是使用生物工厂平台探索对抗疾病的新方法。我们中的两位(Keasling 和 Baker)运营的实验室致力于为困扰人类的两种最隐匿的疾病——疟疾和 HIV——开发治疗方法。尽管我们正在研究不同类型的疗法,但我们两个小组的工作都严重依赖于合成长而精确的 DNA 片段的能力。因此,我们的项目提供了生物工厂方法将如何大大改变生物医学科学家开发新疗法的方式的例子。
就疟疾而言,已经存在一种治疗方法,可以从感染者的身体中根除致病寄生虫。它是小分子 C-15 倍半萜,俗称青蒿素,一种由黄花蒿植物制成的天然化合物,主要产于中国北方。然而,这些树木产生的这种物质太少,无法以可承受的成本广泛部署这种药物。这就是 Keasling 小组在过去五年中一直致力于复制基因集合(称为基因通路)的原因,该基因集合负责在树木中制造青蒿素并将其插入酵母中以大规模生产该化合物。
一旦进入酵母体内,这条途径也可以被修改为比在天然植物中运行得更有效。到目前为止,我们已经能够重新设计基因的关键子集(统称为甲羟戊酸途径),以生产一种称为紫穗烯的青蒿素前体,其产量是原始途径在细菌中产生的 100,000 倍。进一步提高产量,达到使药物广泛可用的程度,将需要我们以集成的方式重新设计整个青蒿素途径。
完整的途径由九个基因组成,每个基因的平均长度约为 1,500 个 DNA 碱基。因此,我们构建的每个新版本的途径都包含大约 13,000 个碱基。如果我们能够制作途径中每个基因的变体,那将对我们有所帮助,这样我们就可以看到哪些组合效果最好。仅制造每个基因的两个变体意味着合成 29 或 512 个构建体,总共约 600 万个核苷酸碱基。使用传统的 DNA 合成技术,这是一个极具挑战性的目标,但如此大量的 DNA 可以容纳在单个微阵列芯片上。
使大规模合成基因网络成为可能的技术也可用于生成新型蛋白质,例如用于合成化学反应或环境废物修复的新型催化剂,以及用于基因治疗或病原体破坏的高度特异性酶。Baker 的小组正在开发用于设计此类新型蛋白质结构的计算方法,包括两种模拟 HIV 表面基本特征的结构,这些结构已在作为潜在疫苗进行测试。
问题在于计算机模型不够先进,无法保证每个新设计的蛋白质都具有所需的功能,但计算机可以生成数十或数百个有希望的候选结构进行尝试。将所有这些结构转化为基因序列将需要合成数十万个 DNA 碱基——使用当前技术这是一个困难且昂贵的命题,但在第一代生物工厂技术的触及范围内。
这些针对疟疾和 HIV 的 DNA 和蛋白质合成项目说明了一种由生物工厂技术支持的方法,该方法可以应用于更广泛的疾病,包括新出现的威胁。例如,通过结合高速、低成本的 DNA 测序方法[参见 George M. Church 的《人人都可拥有基因组》;《大众科学》,1 月刊] 以及工厂的合成能力,可以对 SARS 等新型病毒或新型流感毒株进行表征,并且可以比目前可能的速度更快地准备好针对它们的蛋白质疫苗。
当然,生物工厂不仅仅是一系列更快的合成技术的集合。它是一种思考现有生物机器和构建新生物机器的方式,借鉴了工程学的语言和方法论。
生物砖
2000 年,当时在普林斯顿大学的 Michael Elowitz 和 Stanislas Leibler,以及我们中的一位(Collins)与波士顿大学的同事 Tim Gardner 和 Charles Cantor 一起,用生物部件构建了第一个基本电路元件——环形振荡器和触发开关。科学家们已经知道大约 25 年,天然生物体使用这种类型的电路来调节自身的基因,但我们两个团队的独立努力代表了制造功能性人工生物电路的首次成功。
Elowitz 和 Leibler 的环形振荡器很好地说明了我们所说的术语,他们最初尝试构建合成生物钟,希望它能提供对生物系统中自然存在的生物钟的深入了解。他们的基本电路包括一个称为质粒的 DNA 环,其中包含三个基因:tetR、lacI 和 cI,它们分别编码蛋白质 TetR、LacI 和 cI。为了将任何基因翻译成蛋白质,酶聚合酶必须首先与位于基因上游的 DNA 链区域(称为启动子)结合。然后,聚合酶将基因转录为信使 RNA,信使 RNA 继而被翻译成蛋白质。如果聚合酶无法与启动子结合,则基因不会被翻译,蛋白质也不会被制造出来。
Elowitz 和 Leibler 安排他们电路中三个基因的蛋白质产物选择性地结合到彼此的启动子区域。因此,LacI 蛋白将结合 tetR 启动子,而 cI 蛋白将结合 lacI 基因的启动子,TetR 将结合 cI 基因的启动子。这些相互关系使一个基因的蛋白质产物能够阻止聚合酶与另一个基因的启动子结合。因此,三种蛋白质的制造以振荡周期发生:大量的 LacI 蛋白抑制 tetR 基因活性;然后,TetR 蛋白的缺失允许 cI 基因被开启,这具有抑制 LacI 产生的效果,依此类推。
当该循环中的一种蛋白质产物也与制造绿色荧光蛋白的基因连接,并且整个电路被插入细菌中时,可以观察到该装置的振荡,因为细菌像节日彩灯一样闪烁。同样,最新版本的 Collins 小组的基因触发开关可用于编程细菌以检测细胞 DNA 损伤,然后通过将它们自身排列成称为生物膜的绿色荧光草坪来报告它们的发现。
关于这些合成生物电路,也许最引人注目的是,它们的功能与电子工程师在想要测试制造半导体芯片的新工艺时构建的第一种类型的电路相同。工程师们知道,诸如振荡器或开关之类的基本组件在逻辑上是完备的。能够可靠且准确地构建这些简单的部件,就使得设计和制造更复杂的电路成为可能。一旦生物工程师也能理所当然地接受这些基本构建块,他们就可以继续进行更复杂的项目,例如多细胞系统、二维和三维设计以及功能非生物的设备。
我们中的一位(Weiss)最近为一种多细胞系统制作了一个原型,该系统可以用于例如检测爆炸物或其他化学物质,然后用可见信号报告它们[参见第 47 页的方框]。这种生物机器使我们能够用指令和协议对数百万个细菌细胞进行编程,这些指令和协议既用于在执行命令时相互通信,又用于以各种模式输出光信号。
受到这些早期例子的启发,我们中的一位(Endy)与 Knight 和我们在麻省理工学院的同事 Randy Rettberg 一起,正在开发一个类似于芯片设计师可用的库的生物组件库。这个标准生物部件注册库应该有助于广泛的生物构建项目,我们希望其他人也能贡献新的条目。到目前为止,该注册库包含 1,000 多个单独的生物砖,正如我们所称的那样,包括许多类似于电子设备的部件,例如反相器、开关、计数器、放大器以及可以接收输入或输出显示的组件。我们还定义了一个标准信号载体——每秒聚合酶或 PoPS——类似于连接两个电子元件的导线中的电流,以便生物工厂工程师可以更轻松地组合和重用基因设备。
为了展示工厂方法的威力并为这个新领域播下种子,麻省理工学院小组在 2003 年开设了第一个使用生物部件进行工厂式工程的课程。该课程迅速发展成为一年一度的竞赛,今年夏天将吸引来自 30 多所大学的团队参加。在其短暂的存在期间,国际基因工程机器 (iGEM) 竞赛已经产生了一些惊人的细胞装置,包括可以记录和显示照片的生物膜,以及能够像开关一样感知小分子输入(如咖啡因)并做出反应的程序化细胞。
我们中的三位(Smolke、Collins 和 Church)开发的另一个 iGEM 条目是一种能够使用一系列 DNA 片段进行数字计数的设备。20 个这样的 DNA 位足以计数和报告多达一百万 (220) 个细胞状态。这项技术可以集成到传感器中,传感器又可以连接到工程代谢途径,例如 Keasling 小组的青蒿素生产优化版本。这将使所需药物的生产在字面上通过拨动开关即可增加。
构建合成生物学
当我们这篇文章的作者开始努力构建生物工厂时,尚无明确的方法可以准确、快速且廉价地制造长 DNA 构建体。今天,这只是生物工程不断扩展的工具箱中的几种技术之一。我们正在朝着首先在计算机中设计和建模生物设备,然后在最后一步将它们切割成生物形式的方向发展——就像硅芯片的规划然后蚀刻一样。
与半导体电路一样,这种方法还具有允许我们优化部件之间相互作用并预测错误的额外好处。随着构建的系统变得越来越复杂,这种能力变得越来越有用。抽象设计的另一个优点是,生物工程师不需要从头开始构建每个部件,甚至不需要知道每个部件如何在内部工作——只需要知道它们是否可靠地工作即可。
参加 iGEM 的学生可能代表了第一代从职业生涯一开始就接受培训,将自己视为生物学家和工程师的人。然而,未来的一个重要挑战将是让更多的生物学家像硅工程师一样思考(并吸引更多的工程师进入生物学领域)——尤其是在共享部件方面。到目前为止,生物技术的特点是自成一体的团队致力于开发单一用途的应用程序,例如一种药物化合物。生物技术的未来很大程度上将需要许多不同的团队贡献子系统。我们希望构建生物学工厂将促进这种发展,并有助于促进像半导体行业取得的革命性进步一样的进步。
作者
生物工厂小组成员包括华盛顿大学的 David Baker、哈佛医学院的 George Church、波士顿大学的 Jim Collins、麻省理工学院的 Drew Endy 和 Joseph Jacobson、加州大学伯克利分校的 Jay Keasling、杜克大学的 Paul Modrich、加州理工学院的 Christina Smolke 和普林斯顿大学的 Ron Weiss。他们是朋友、同事和不时合作者,他们作为一个小组撰写了这篇文章,因为他们的专业知识的多样性,以及他们对生物工厂工作的贡献,体现了生物工程的跨学科性质。所有作者也是位于马萨诸塞州剑桥市的 Codon Devices 的科学顾问,Codon Devices 是第一家应用工程原理于合成生物学的商业企业。Church、Endy、Jacobson 和 Keasling 是其创始人之一。Endy 也是非营利性 BioBricks 基金会的创始人,Keasling 创立了 Amyris Biotechnologies。