勇往直前，不断复制

鸟类会这样做，蜜蜂也会这样做，但是机器可以做到吗？计算机模拟表明答案是肯定的

苹果生苹果，但是机器可以生机器吗？今天，即使制造一台简单的机器也需要精密的制造设备。我们能否赋予人造设备自行繁殖的能力？长期以来，自我复制一直被认为是区分生物和非生物的基本属性之一。从历史上看，我们对生物繁殖如何运作的有限理解使其蒙上了一层神秘的面纱，并使人们认为人造物体不可能做到这一点。据报道，当勒内·笛卡尔向瑞典女王克里斯蒂娜断言动物只是另一种形式的机械自动机时，女王陛下指着一个时钟说：“注意让它产生后代。”

机器自我复制的问题在 20 世纪 40 年代后期随着杰出的数学家和物理学家约翰·冯·诺伊曼的工作从哲学领域进入科学和工程领域。一些研究人员实际上已经构建了物理复制器。例如，大约 50 年前，遗传学家莱昂内尔·彭罗斯和他的儿子罗杰（著名物理学家）建造了小型胶合板组件，这些组件表现出一种简单的自我复制形式。但自我复制已被证明非常困难，以至于大多数研究人员使用冯·诺伊曼开发的概念工具来研究它：二维元胞自动机。

在计算机上实现的元胞自动机可以模拟各种各样的自我复制器，这些复制器相当于具有与我们自身物理定律不同的简朴宇宙。这些模型使研究人员不必担心能源和物理构造等后勤问题，从而可以专注于信息流的基本问题。生物如何能够不借助外力进行复制，而机械物体却必须由人类建造？生物体层面的复制是如何从组织、细胞和分子中的众多相互作用中产生的？达尔文进化论是如何产生自我复制生物的？

支持科学新闻报道

如果您喜欢这篇文章，请考虑通过以下方式支持我们屡获殊荣的新闻报道订阅。通过购买订阅，您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。

新兴的答案启发了自修复硅芯片[参见第 54 页和 55 页的专栏]和自催化分子的开发。这可能仅仅是开始。纳米技术领域的研究人员长期以来一直认为，自我复制对于制造分子级机器至关重要，而太空探索的支持者则将该过程的宏观版本视为使用原位材料殖民行星的一种方式。最近的进展为这些听起来具有未来感的想法提供了可信度。与其他科学学科一样，包括遗传学、核能和化学，我们这些研究自我复制的人面临着双重挑战：创造复制机器并避免对设备失控的反乌托邦式预测。我们获得的知识将帮助我们区分好的技术和具有破坏性的技术。

[分隔符] 生命游戏

科幻故事经常将控制论的自我复制描述为当前技术的自然发展，但它们掩盖了它提出的深刻问题：如何避免无限倒退。一个系统可能会尝试使用蓝图（即自我描述）来构建克隆。然而，自我描述是机器的一部分，不是吗？如果是这样，那么是什么描述了描述？又是什么描述了描述的描述？在这种情况下，自我复制就像要求建筑师制作自己工作室的完美蓝图。蓝图必须包含蓝图的微型版本，而该版本又将包含蓝图的微型版本，依此类推。如果没有这些信息，施工人员将无法完全重建工作室；蓝图所在的位置将是一片空白。

冯·诺伊曼的伟大洞见是对如何摆脱无限倒退的解释。他意识到自我描述可以以两种不同的方式使用：首先，作为指令，其解释导致构建设备的相同副本；其次，作为要复制的数据，不加解释地附加到新创建的子设备上，以便它也具有自我复制的能力。通过这两个步骤，自我描述无需包含自身的描述。在建筑学的类比中，蓝图将包括建造复印机的计划。一旦新的工作室和复印机建成，施工人员只需复印一份蓝图并将其放入新的工作室即可。

活细胞完全以这两种方式使用它们的自我描述，生物学家称之为基因型：转录（DNA 主要以不加解释的方式复制以形成 mRNA）和翻译（mRNA 被解释以构建蛋白质）。冯·诺伊曼在分子生物学家之前几年就提出了转录-翻译的区别，他的工作对于理解自然界中的自我复制至关重要。

为了证明这些想法，冯·诺伊曼和数学家斯坦尼斯瓦夫·M·乌拉姆提出了元胞自动机的想法。元胞自动机模拟涉及棋盘状的方格或单元格网格，每个单元格要么是空的，要么被几种可能的组件之一占据。在离散的时间间隔内，每个单元格都会查看自身及其邻居，并决定是否变形为不同的组件。在做出此决定时，单元格遵循相对简单的规则，这些规则对于所有单元格都相同。这些规则构成了元胞自动机世界的基本物理学。所有决策和行动都在本地进行；单元格不直接知道其直接邻域之外发生的事情。

元胞自动机表面上的简单性具有欺骗性；这并不意味着设计容易或行为贫乏。最著名的自动机，约翰·霍顿·康威的生命游戏，产生了令人惊叹的复杂模式。关于元胞自动机动态行为的许多问题在形式上是无法解决的。要了解模式将如何展开，您需要完全模拟它。在某种程度上，元胞自动机模型可以像现实世界一样复杂。

[分隔符] 复印机

在元胞自动机中，当一组组件——“机器”——经历一系列步骤来构建附近自身的副本时，就会发生自我复制。冯·诺伊曼的机器基于通用构造器，这是一种机器，在给出适当的指令后，可以创建任何模式。该构造器由分布在数万个单元格上的多种类型的组件组成，并且需要用一本书长度的手稿才能指定。由于其复杂性，它仍然没有被完全模拟，更不用说实际构建了。在生命游戏中，构造器会更加复杂，因为冯·诺伊曼模型中单个单元格执行的功能（例如信号传输和新组件的生成）必须由生命游戏中的复合结构来执行。

走向另一个极端，很容易找到自我复制的简单示例。例如，假设元胞自动机只有一种类型的组件，标记为 +，并且每个单元格仅遵循一个规则：如果四个相邻单元格中只有一个包含 +，则该单元格变为 +；否则它将变成空的。根据此规则，单个 + 会长成另外四个 +，每个 + 也会同样生长，依此类推。

这种杂草丛生的扩散并没有为复制原理提供太多启示，因为没有重要的机器。当然，这就引出了一个问题，即如何区分“重要的”机器和微不足道的、多产的自动机。没有人提出令人满意的答案。然而，显而易见的是，复制结构在某种意义上必须是复杂的。例如，它必须由多个、不同的组件组成，这些组件的相互作用共同促成复制——俗话说，“整体必须大于部分之和。” 多个不同组件的存在允许将自我描述存储在复制结构中。

自冯·诺伊曼的开创性工作以来，许多研究人员一直在复杂和微不足道之间探索，开发出需要更少组件、更少空间或更简单规则的复制器。1984 年，当时在密歇根大学的克里斯托弗·G·兰顿取得了重大进展，他观察到环状存储设备（它构成了早期自我复制机器的模块）可以被编程为自行复制。这些设备通常由两部分组成：环本身，它是一串围绕矩形循环的组件，以及一个构造臂，它从矩形的一个角伸入周围空间。循环组件构成了环的配方——例如，“向前移动三个方格，然后左转。” 当此配方到达构造臂时，自动机规则会复制它。一个副本继续绕环循环；另一个副本向下移动到臂上，在那里它被解释为指令。

通过放弃通用构造的要求（这是冯·诺伊曼方法的中心），兰顿表明，复制器可以仅用七个独特的组件构建，仅占用 86 个单元格。我们中的一位（雷吉亚）和我们的同事也设计了更小、更简单的自复制环[参见下一页的专栏]。因为它们具有多个相互作用的组件并包含自我描述，所以它们不是微不足道的。有趣的是，不对称性起着意想不到的作用：当组件不是旋转对称时，控制复制的规则通常比组件是旋转对称时更简单。

[分隔符] 涌现复制

所有这些自我复制结构都是通过独创性和大量的反复试验设计的。这个过程是艰巨且常常令人沮丧的；对规则的微小更改会导致完全不同的全局行为，最有可能导致所讨论结构的解体。但最近的工作已经超越了直接设计方法。研究人员没有定制规则来适应特定类型的结构，而是试验了各种规则集，在元胞自动机网格中填充了随机选择的组件的“原始汤”，并检查是否自发地出现了自我复制器。

1997 年，现在在爱荷华州立大学的周惠贤和雷吉亚注意到，只要自由浮动组件的初始密度高于某个阈值，小的自复制环就会可靠地出现。碰撞的环会发生湮灭，因此存在一个持续的死亡和诞生过程。随着时间的推移，环扩散、尺寸增大，并通过过去碰撞碎片触发的突变而进化。尽管自动机规则是确定性的，但这些突变实际上是随机的，因为系统很复杂并且组件从随机位置开始。

这些环旨在作为抽象机器，而不是任何生物学事物的模拟物，但将它们与生物分子结构进行比较是很有趣的。环松散地类似于细菌中的环状 DNA，而构造臂充当催化 DNA 复制的酶。更重要的是，复制环说明了复杂的全局行为如何从简单的局部相互作用中产生。例如，组件围绕环移动，即使规则中没有关于移动的任何内容；实际发生的是，单个单元格正在激活、死亡或变形，从而使模式从一个位置消除并在其他位置重建——我们将其感知为运动的过程。简而言之，元胞自动机在本地行动，但似乎在全球范围内思考。分子生物学在很大程度上也是如此。

在最近的一次计算实验中，现在在 NASA 艾姆斯研究中心的杰森·洛恩和雷吉亚试验了不同的规则集，而不是不同的结构。从任意四个组件的块开始，他们发现他们可以确定一组规则，使该块自我复制。他们通过遗传算法（一种模拟达尔文进化的自动化过程）发现了这些规则。

这项工作最具挑战性的方面是所谓的适应度函数的定义——通过该函数来判断规则集的标准，从而将好的解决方案与坏的解决方案分开，并将进化过程推向促进复制的规则集。您不能简单地为那些导致结构复制的规则集分配高适应度，因为最初的规则集都不太可能允许复制。解决方案是设计一个适应度函数，该函数由三个度量的加权和组成：增长度量（每种组件类型产生越来越多的该组件的程度）、相对位置度量（相邻组件保持在一起的程度）和复制器度量（实际存在的复制器数量的函数）。使用正确的适应度函数，进化可以将无菌的规则集变成肥沃的规则集；该过程通常需要大约 150 代。

以这种方式发现的自我复制结构的工作方式与自我复制环的工作方式根本不同。例如，它们移动并在沿途沉积副本——这与基本上是静态的复制环不同。尽管这些新发现的复制器由多个局部相互作用的组件组成，但它们没有可识别的自我描述——没有明显的基因组。在没有自我描述的情况下进行复制的能力可能与最早的生物复制器是如何起源的问题有关。在某种意义上，研究人员看到了非生物和生物结构之间的连续统一体。

许多研究人员尝试了除传统元胞自动机之外的其他计算模型。在异步元胞自动机中，单元格不是同步更新的；在非均匀元胞自动机中，规则可能因单元格而异。另一种完全不同的方法是核心战争及其后继者，例如生态学家托马斯·S·雷的蒂埃拉系统。在这些模拟中，“生物”是争夺处理器时间和内存的计算机程序。雷观察到“寄生虫”的出现，它们窃取了其他生物的自我复制代码。

[分隔符] 走向现实

那么这些机器有什么用呢？冯·诺伊曼的通用构造器除了复制之外还可以计算，但它是一种不切实际的野兽。一项重大进展是简单而有用的复制器的开发。1995 年，洛桑瑞士联邦理工学院的吉安卢卡·滕佩斯蒂简化了环的自我描述，使其可以与一个小型程序交织在一起——在本例中，该程序将拼写出他实验室的首字母缩写“LSL”。他的洞见是创建自动机规则，允许环分两个阶段复制。首先，环像兰顿的环一样，复制自身。完成后，子环向其父环发送信号，此时父环发送用于写出字母的指令。

绘制字母只是一个演示。次年，让-伊夫·佩里尔、雅克·赞德和我们中的一位（西珀）设计了一个具有通用计算能力的自复制环——也就是说，具有通用图灵机的计算能力，通用图灵机是一种高度简化但功能齐全的计算机。该环有两个“磁带”，或组件的长字符串，一个用于程序，另一个用于数据。除了自我复制外，环还可以执行任意程序。在某种意义上，它们与模拟它们的计算机一样复杂。它们的主要局限性在于程序是从父环复制到子环的，没有更改，因此所有环都执行相同的指令集。

1998 年，周和雷吉亚消除了这一限制。他们展示了如何使用携带不同信息而不是克隆程序的自复制环来解决一个称为可满足性的问题。环可用于确定逻辑表达式中的变量是否可以被赋值，以使整个表达式的计算结果为“真”。这个问题是 NP 完全问题——换句话说，它属于一类棘手的难题，包括著名的旅行商问题，对于这些难题，目前还没有已知的有效解决方案。在周和雷吉亚的元胞自动机宇宙中，每个复制器都收到一个不同的部分解决方案。在复制过程中，解决方案发生突变，有希望的解决方案的复制器被允许扩散，而失败的解决方案的复制器则消亡。

尽管各个团队已经在电子硬件中创建了元胞自动机，但对于实际应用来说，此类系统可能过于浪费；自动机从来没有真正打算直接实现。它们的目的是阐明复制的基本原理，并通过这样做，启发更具体的努力。这些环为设计由晶体管或化学物质组成的并行计算机提供了一种新的范例。

1980 年，由小罗伯特·弗雷塔斯领导的 NASA 团队提议在月球上建立一个工厂，该工厂将利用当地月球材料进行自我复制，以指数级地覆盖大片区域。事实上，正如杜兰大学物理学家弗兰克·J·蒂普勒所论证的那样，类似的探测器可以殖民整个银河系。在较近的时期，计算机科学家和工程师一直在试验机器人的自动化设计。尽管这些系统并非真正的自我复制——后代比亲代简单得多——但它们是朝着实现瑞典女王的要求迈出的第一步。

如果物理自我复制机器变得实用，它们和相关技术将引发难题，包括终结者电影中人造生物胜过自然生物的场景。我们更倾向于更乐观、更可能的场景，即复制器将被用于造福人类。关键是要采纳 14 世纪英国哲学家威廉·奥卡姆的建议：entia non sunt multiplicanda praeter necessitatem——实体不应在不必要的情况下增加。

[分隔符] 作者

摩西·西珀和詹姆斯·A·雷吉亚对复杂系统如何自组织有着长期的兴趣。西珀是以色列本-古里安大学计算机科学系副教授。他主要对进化计算感兴趣，主要应用于游戏和生物信息学。雷吉亚是马里兰大学高级计算机研究所的计算机科学和神经病学教授。除了研究自我复制之外，他还对大脑及其疾病（如中风）的计算模型进行研究。