量子 SETI

海量数据集和机器学习可能将 SETI 与量子计算联系起来

加入我们的科学爱好者社区!

本文发表于《大众科学》的前博客网络,仅反映作者的观点,不一定反映《大众科学》的观点


宇宙的问题在于它太大了。不仅仅是在物理尺度上相对于人类所占据的领域而言很大,而且在原子、分子、小行星、行星、恒星和星系的绝对数量方面也很大。这意味着,如果你想在宇宙中寻找一些特殊的东西,你必须花费大量的时间和精力来筛选掉其他一切。

也许在探索宇宙中是否存在其他技术物种的努力中,这种挑战最为明显。数字令人震惊。据估计,我们的银河系拥有多达 4000 亿颗恒星。我们现在怀疑大多数恒星都会拥有行星系统。如果其中任何地方能够维持复杂的、可交流的生命,那么就存在着无数的渠道,它们可以通过这些渠道——无论是故意的还是无意的——向银河系的其他地方暴露它们的存在。

无线电传输可能存在于数千甚至数百万个离散频率上。或者在可见光、红外线、紫外线,甚至伽马射线频率的其他电磁辐射中。所有这些都能够被脉冲调制、调制、极化,并随时间和根据未知的策略或意外而变化。可能存在物理结构遮蔽了原本自然的星光,或者发出热能。或者是有意的中微子发射、引力波、工程分子振动发射和同位素编码信息。清单非常庞大。


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


目前,我们仅仅触及了表面。即使量化我们的缺点也相当具有挑战性。在 2018 年,Wright、Kanodia 和 Lubar 的一篇论文对无线电搜索应用了多维测量,并得出结论,用通俗的话说,到目前为止,我们“看”到的相当于地球海洋中一个热水浴缸的水量。

但是,改进这项工作正在进行中。最近,“突破聆听”项目发布了一个新的数据集,其中包含约 2PB 的射电望远镜数据(来自绿岸和帕克斯天文台)。该数据包括围绕银河系平面的系列测量(包括 20 个已知的系外行星系统,它们可能见证地球凌日太阳)、银河系中心和星际彗星 2I/鲍里索夫。

然而,尽管这些原始数据令人印象深刻,但它也仅代表了开始真正限制我们附近技术可见生命几率所需的一小部分。这就引出了一个问题,即随着 SETI 数据的规模越来越大,我们将如何处理它们。

关键问题之一是我们不希望不适当地偏向我们审查数据的方式。也许在某个地方存在一个非常干净的“信号”,它是无可辩驳的人造和地外起源。但也可能没有。我们如何寻找我们不知道的东西?许多研究人员已经认真思考过这个问题。一种特别有希望的攻击路线可能是利用过去十年左右机器学习的非凡进步。特别是深度学习系统(虚拟神经网络的层和嵌套)擅长感知数据中复杂而微妙的相关性和模式。

像生成对抗网络和卷积神经网络这样的方法已经被研究作为筛选 SETI 数据的方法——在没有不适当的先入之见的情况下寻找不寻常的结构。一旦系统经过训练,它就可以非常高效地处理数据。但问题是,训练可能是一项巨大的计算负担。特别是当“规则集”本身是由深度学习系统发现时;当我们尽可能地将人类排除在循环之外时。

SETI 挑战的巨大性可能不仅仅在于数据集的规模(以及首先获取这些数据集),还在于问题的开放性。一旦我们考虑到我们可能不知道信号是如何编码的(无论是在无线电还是光线中,或其他方式),游戏很快就会变得非常非常昂贵。例如,谷歌的“Transformer”深度学习系统可以在数千个处理器上运行,以训练数亿个参数。但能源成本是惊人的,训练运行记录了相当于数十万磅二氧化碳的碳足迹

答案是什么?可能在于量子计算。尽管围绕量子计算存在令人痛苦的炒作(和误解),但它确实为当前深度学习系统所依赖的某些任务(例如,非常大的矩阵操作)带来了巨大的希望。我们最终有可能利用量子计算来帮助训练我们的机器,然后将它们释放到庞大的 SETI 数据集上。以我们甚至无法想象的方式寻找信号。

当然,可能在我们需要所有这些之前,我们就会很幸运。但如果我们没有,那么我们发现其他智能的最佳工具可能源于自然界最深刻、最令人费解的规则,这种想法具有一定的诗意。

© . All rights reserved.