量子物理学家马里奥·克伦回忆起 2016 年初,他坐在维也纳的一家咖啡馆里,仔细研读计算机打印稿,试图理解 MELVIN 发现了什么。MELVIN 是克伦构建的一种机器学习算法,一种人工智能。它的任务是混合搭配标准量子实验的构建模块,并找到新问题的解决方案。它确实找到了许多有趣的解决方案。但其中有一个让人摸不着头脑。“我当时想到的第一件事是,‘我的程序有漏洞,因为这个解决方案不可能存在’,”克伦说。
MELVIN 似乎解决了创建涉及多个光子的高度复杂纠缠态的问题(纠缠态是指那些曾经让阿尔伯特·爱因斯坦援引“幽灵般的超距作用”的幽灵的状态)。克伦、维也纳大学的安东·塞林格及其同事并没有明确向 MELVIN 提供生成如此复杂状态所需的规则,但它却找到了一种方法。最终,克伦意识到该算法重新发现了一种实验装置,这种装置是在 20 世纪 90 年代初设计的。但那些实验要简单得多。MELVIN 破解了一个远比以往复杂得多的难题。“当我们理解发生了什么时,我们立即能够推广[该解决方案],”现在在多伦多大学工作的克伦说。
从那时起,其他团队也开始进行 MELVIN 识别出的实验,使他们能够以新的方式测试量子力学的概念基础。与此同时,克伦与多伦多的同事合作,改进了他们的机器学习算法。他们的最新成果,一个名为 THESEUS 的人工智能,提高了赌注:它比 MELVIN 快几个数量级,而且人类可以很容易地解析其输出。克伦和他的同事可能需要几天甚至几周才能理解 MELVIN 的曲折思路,但他们几乎可以立即弄清楚 THESEUS 在说什么。“这是一项了不起的工作,”苏黎世联邦理工学院理论物理研究所的理论量子物理学家雷纳托·伦纳说,他审阅了 2020 年关于 THESEUS 的一项研究,但没有直接参与这些工作。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑支持我们屡获殊荣的新闻报道,方式是 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
克伦偶然发现了整个研究计划,这有点偶然,当时他和他的同事试图弄清楚如何在实验上创建以非常特殊的方式纠缠的光子量子态。当两个光子相互作用时,它们会变得纠缠,并且两者只能使用单个共享量子态进行数学描述。如果您测量一个光子的状态,即使两个光子相距数公里,测量也会立即确定另一个光子的状态(因此爱因斯坦对纠缠的评论是“幽灵般的”)。
1989 年,三位物理学家——丹尼尔·格林伯格、已故的迈克尔·霍恩和塞林格——描述了一种纠缠态,该状态后来被称为 GHZ(以他们的首字母命名)。它涉及四个光子,每个光子都可能处于例如两个状态 0 和 1 的量子叠加态(称为量子比特的量子态)。在他们的论文中,GHZ 态涉及纠缠四个量子比特,使得整个系统处于状态 0000 和 1111 的二维量子叠加态。如果您测量其中一个光子并发现它处于状态 0,则叠加态将坍缩,而其他光子也将处于状态 0。状态 1 也是如此。在 20 世纪 90 年代后期,塞林格和他的同事首次在实验上观察到使用三个量子比特的 GHZ 态。
克伦和他的同事的目标是更高维度的 GHZ 态。他们希望使用三个光子,其中每个光子的维度为三,这意味着它可能处于三种状态的叠加态:0、1 和 2。这种量子态称为 三元量子比特。该团队追求的纠缠是三维 GHZ 态,它是状态 000、111 和 222 的叠加态。这种状态是安全量子通信和更快量子计算的重要组成部分。2013 年末,研究人员花费数周时间在黑板上设计实验并进行计算,以查看他们的装置是否可以生成所需的量子态。但每次都失败了。“我想,‘这绝对是疯了。为什么我们想不出一个装置?’”克伦说。
为了加快这一过程,克伦首先编写了一个计算机程序,该程序接受实验装置并计算输出。然后,他升级了该程序,使其能够将实验人员用于在光学工作台上创建和操纵光子的相同构建模块纳入其计算中:激光器、非线性晶体、分束器、移相器、全息图等等。该程序通过随机混合和匹配构建模块来搜索大量的配置空间,执行计算并输出结果。MELVIN 由此诞生。“在几个小时内,该程序找到了一种解决方案,而我们科学家——三位实验学家和一位理论家——几个月都想不出来,”克伦说。“那是疯狂的一天。我简直不敢相信它发生了。”然后他赋予 MELVIN 更多的智慧。每当它找到一个有用的装置时,MELVIN 都会将该装置添加到其工具箱中。“该算法会记住这一点,并尝试将其重用于更复杂的解决方案,”克伦说。
正是这个更先进的 MELVIN 让克伦在维也纳的一家咖啡馆里挠头。他设置它运行时,实验工具箱中包含两个晶体,每个晶体都能够生成一对三维纠缠的光子。克伦天真的期望是 MELVIN 会找到将这些光子对组合起来以创建最多九维纠缠态的配置。但“它实际上找到了一种解决方案,一种极其罕见的情况,它比其余状态具有更高的纠缠度,”克伦说。
最终,他弄清楚 MELVIN 使用了一种多个团队在近三十年前开发的技术。1991 年,当时都在罗切斯特大学的 Xin Yu Zou、Li Jun Wang 和 Leonard Mandel 设计了一种方法。1994 年,当时在奥地利因斯布鲁克大学的塞林格和他的同事提出了另一种方法。从概念上讲,这些实验试图实现类似的目标,但塞林格和他的同事设计的配置更容易理解。它从一个晶体开始,该晶体生成一对光子(A 和 B)。这些光子的路径直接穿过另一个晶体,该晶体也可以生成两个光子(C 和 D)。来自第一个晶体的光子 A 和来自第二个晶体的光子 C 的路径完全重叠,并通向同一个探测器。如果该探测器发出咔哒声,则无法判断光子是来自第一个晶体还是第二个晶体。光子 B 和 D 也是如此。
移相器是一种有效地增加光子传播路径(为其波长的一部分)的设备。如果您在晶体之间的路径之一中引入移相器并不断改变相移量,则可能会在探测器处引起相长和相消干涉。例如,每个晶体每秒可能会生成 1,000 对光子。通过相长干涉,探测器每秒将记录 4,000 对光子。通过相消干涉,它们将检测不到任何光子:即使单个晶体每秒生成 1,000 对光子,整个系统也不会产生任何光子。“当你想到这一点时,实际上非常疯狂,”克伦说。
MELVIN 的古怪解决方案涉及这种重叠路径。让克伦感到困惑的是,该算法的工具箱中只有两个晶体。它没有在实验装置的开头使用这些晶体,而是将它们楔入干涉仪(一种将光子路径(例如)分成两条路径,然后再将它们重新组合的设备)内部。经过大量努力,他意识到 MELVIN 找到的装置相当于一个涉及两个以上晶体的装置,每个晶体都生成光子对,使得它们通向探测器的路径重叠。该配置可用于生成高维纠缠态。
量子物理学家诺拉·蒂施勒在 MELVIN 接受测试时是塞林格的一名博士生,研究一个不相关的课题,她一直在关注这些进展。“从一开始就很清楚,[这样的]实验如果没有被算法发现,就不会存在,”她说。
除了生成复杂的纠缠态外,使用两个以上晶体的重叠路径的装置还可以用于执行塞林格 1994 年使用两个晶体进行的广义形式的量子干涉实验。埃弗雷姆·斯坦伯格是一位实验主义者,他是克伦在多伦多的同事,但没有参与这些项目,他对人工智能的发现印象深刻。“据我所知,这是在过去几十年中没有人梦想过的概括,并且可能永远不会做到,”他说。“这是思考机器可以带我们进行的这类新探索的绝佳首例。”
在一种具有四个晶体的广义配置中,每个晶体生成一对光子,并且重叠路径通向四个探测器,量子干涉可以创建所有四个探测器都发出咔哒声(相长干涉)或所有探测器都不发出咔哒声(相消干涉)的情况。直到最近,进行这样的实验仍然是一个遥远的梦想。然后,在 3 月份的一篇预印本论文中,由中国科学技术大学的冯兰田领导的团队与克伦合作报告说,他们已经在单个光子芯片上制造了整个装置并进行了实验。研究人员收集了超过 16 个小时的数据:这要归功于光子芯片令人难以置信的光学稳定性,这在更大规模的台面实验中是不可能实现的。斯坦伯格说,首先,该装置将需要一平方米的光学元件精确地排列在光学工作台上。此外,“在这 16 个小时内,单个光学元件抖动或漂移千分之一人头发的直径就足以消除这种效应,”他说。
在他们早期尝试简化和概括 MELVIN 的发现时,克伦和他的同事意识到该解决方案类似于称为图的抽象数学形式,图包含顶点和边,用于描述对象之间的成对关系。对于这些量子实验,光子所取的每条路径都用一个顶点表示。例如,晶体用连接两个顶点的边表示。MELVIN 首先生成这样的图,然后在图上执行数学运算。该运算称为完美匹配,涉及生成一个等效图,其中每个顶点仅连接到一条边。此过程使计算最终量子态变得容易得多,尽管人类仍然难以理解。
这种情况随着 MELVIN 的继任者 THESEUS 而改变,后者通过将其找到的表示解决方案的第一个复杂图精简为最少数量的边和顶点(使得任何进一步的删除都会破坏装置生成所需量子态的能力)来生成更简单的图。这种图比 MELVIN 的完美匹配图更简单,因此更容易理解任何人工智能生成的解决方案。伦纳对 THESEUS 的人类可解释输出印象特别深刻。“该解决方案的设计方式是使图中的连接数最小化,”他说。“与你有一个非常复杂的图相比,这是一个我们自然可以更好地理解的解决方案。”
澳大利亚格里菲斯大学的埃里克·卡瓦尔坎蒂对这项工作既印象深刻,又持谨慎态度。“这些机器学习技术代表了一个有趣的发展。对于一位查看数据并解释数据的人类科学家来说,一些解决方案可能看起来像是‘有创意的’新解决方案。但在这个阶段,这些算法仍然远未达到可以说它们正在产生真正的新想法或提出新概念的水平,”他说。“另一方面,我确实认为它们有一天会达到那个水平。所以这些都是婴儿般的步伐——但我们必须从某个地方开始。”斯坦伯格对此表示赞同。“就目前而言,它们只是令人惊叹的工具,”他说。“就像所有最好的工具一样,它们已经使我们能够做一些没有它们我们可能不会做的事情。”