银河系中有多少外星人?天文学家求助于统计学寻找答案

18世纪统计学家和牧师托马斯·贝叶斯的原则,为地外生命普遍存在的最新估计奠定了基础

在1980年12月14日播出的《宇宙》第12集中,该节目的联合创作者和主持人卡尔·萨根向电视观众介绍了天文学家弗兰克·德雷克提出的同名方程式。他用这个方程式计算了银河系中可能与我们联系的高级文明的数量,这些文明可以使用相当于我们现代无线电通信技术的地外技术。萨根的估计范围从“可怜的少数”到数百万。“如果文明在发现射电天文学后没有立即自我毁灭,那么天空可能正轻柔地回响着来自星星的信息,”萨根以他独特的方式说道。

萨根对文明能否在自身的技术“青春期”中幸存下来感到悲观——这个过渡时期是指一种文化在核能、生物工程或无数其他强大能力发展过程中,很容易导致自我毁灭。但在本质上,他对银河系生命和智慧的前景持乐观态度。然而,他这些信念的科学依据充其量是不可靠的。萨根和其他人怀疑,适宜居住的星球上生命的出现一定是宇宙中不可避免的事情,因为地质证据表明,生命在地球上出现的速度令人震惊地快:在四十多亿年前,几乎是在我们的星球从火热的形成中充分冷却下来之后立即出现的。而且,如果像在我们的世界一样,其他行星上的生命迅速出现,并随着时间的推移进化得越来越复杂,那么智慧和技术也可能在整个宇宙中都很普遍。

然而,近年来,一些持怀疑态度的天文学家试图使用一种称为贝叶斯统计学的复杂分析形式,为这些说法提供更多的经验支持。他们专注于两个巨大的未知数:生命从非生物条件下在类地行星上产生的几率——这个过程称为生命起源——以及从那里,智慧出现的几率。即使掌握了这些估计,天文学家们对于它们对宇宙其他地方的生命意味着什么仍存在分歧。这种缺乏共识的原因是,即使是最好的贝叶斯分析,在缺乏地外生命和智慧的硬证据的情况下,也只能发挥有限的作用。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


德雷克方程式,是这位天文学家在1961年提出的,它计算了我们星系中可以通过无线电波发射或接收星际信息的文明数量。它依赖于乘以许多因素,每个因素都量化了我们对星系、行星、生命和智慧的某些方面的了解。这些因素包括ƒp,拥有太阳系外行星的恒星的比例;ne,太阳系外系统中适宜居住的行星的数量;ƒl,生命在宜居行星上出现的比例;等等。

普林斯顿大学的天体物理学家埃德·特纳说:“在德雷克写下[这个方程式]的时候——甚至在25年前——几乎任何一个因素都可能使生命非常稀有。”现在我们知道,恒星周围的世界是常态,而且那些在大小、质量和日照方面与地球相似的世界也很常见。简而言之,似乎不乏生命可以占据的银河系房地产。然而,“整个因素链中最大的不确定性之一是生命开始的可能性——即使在合适的条件下,你也会从化学物质飞跃到生命,”特纳说。

忽略这种不确定性可能会导致天文学家做出相当大胆的声明。例如,上个月,英国诺丁汉大学的汤姆·韦斯特比和克里斯托弗·康塞利斯在计算出银河系中应该至少有36个智能文明能够与我们交流时,登上了头条新闻。该估计是基于一个假设,即智能生命会在其他适宜居住的类地行星形成后约45亿至55亿年出现。

哥伦比亚大学的天文学家大卫·基平说:“这只是一个非常具体和强烈的假设。”“我没有看到任何证据表明这是一个可以安全进行的赌注。”

回答关于生命起源和智慧出现的可能性问题很困难,因为科学家只有一个信息:地球上的生命。“我们甚至真的没有一个完整的数据点,”基平说。“例如,我们不知道生命何时在地球上出现。即使这一点也存在不确定性。”

另一个基于我们当地观察到的情况进行假设的问题是所谓的选择偏差。想象一下,你买了彩票,并在第100次尝试中中了头奖。合理地,你可能会将中彩票的概率定为1%。当然,这个不正确的结论是一种选择偏差,如果你只调查中奖者,而不调查失败者(即,数千万购买了彩票但从未中奖的人)。当谈到计算生命起源的几率时,“我们无法获得失败的案例,”基平说。“这就是为什么我们在解决这个问题时处于非常具有挑战性的境地。”

贝叶斯分析应运而生。该技术使用贝叶斯定理,以18世纪英国统计学家和牧师托马斯·贝叶斯的名字命名。为了计算某些事件(如生命起源)发生的几率,天文学家首先提出一个可能的概率分布——如果你愿意,可以把它看作是最佳猜测。例如,可以假设生命起源在地球形成后1亿至2亿年之间发生的可能性,与之后2亿至3亿年之间或地球历史上任何其他1亿年时间段发生的可能性一样大。这种假设被称为贝叶斯先验,并且是明确提出的。然后,统计学家收集数据或证据。最后,他们结合先验和证据来计算所谓的后验概率。在生命起源的情况下,该概率将是在类地行星上出现生命的几率,给定我们的先验假设和证据。后验不是一个单独的数字,而是一个概率分布,它量化了任何不确定性。例如,它可能表明,生命起源随着时间的推移变得或多或少可能,而不是像先验建议的那样具有均匀的概率分布。

2012年,特纳和他在普林斯顿高等研究院的同事大卫·施皮格尔是首次严格地将贝叶斯分析应用于生命起源的人。在他们的方法中,类日恒星周围的类地行星上的生命,在世界形成后,直到达到某个最短时间tmin才会出现。如果生命在某个最长时间tmax之前没有出现,那么,随着它的恒星老化(并最终死亡),行星上的条件变得过于恶劣,生命起源永远不会发生。在tmintmax之间,特纳和施皮格尔的目的是计算生命起源的概率。

研究人员使用了几种不同的先验概率分布。他们还假设,智慧在生命起源后经过一段固定的时间才会出现。

鉴于这些假设,地球上生命起源的地球物理学和古生物学证据,以及进化论对智慧生命出现的说法,特纳和施皮格尔能够计算出生命起源的不同后验概率分布。尽管生命在地球上早期出现的证据可能确实表明生命起源相当容易,但后验概率并没有对该概率设置任何下限。特纳说,计算结果“并没有排除非常低的概率,这实际上是单样本统计的常识。”尽管生命在地球上迅速出现,但生命起源仍然可能是一个极其罕见的过程。

基平说,特纳和施皮格尔的努力是“首次真正认真地用贝叶斯方法攻击这个问题”。“我认为吸引人的是,他们打破了对生命早期出现的默认的、幼稚的解释。”

即便如此,基平认为研究人员的工作并非没有弱点,他现在试图用他自己更精细的贝叶斯分析来纠正它。例如,基平质疑智慧在生命起源后经过一段固定时间才会出现的假设。他说,这种先验可能是选择偏差的另一个例子——这种概念受到我们自身智慧出现的进化途径的影响。“本着编码你所有无知的精神,为什么不直接承认你也不知道这个数字呢?”基平说。“如果你试图推断生命需要多长时间才能出现,那么为什么不也同时推断智慧呢?”

这个建议正是基平试图做的,他同时估计了生命起源和智慧出现的概率。对于先验,他选择了一种称为杰弗里斯先验的东西,这是由另一位英国统计学家和天文学家哈罗德·杰弗里斯设计的。据说它是最大程度地不提供信息的。由于杰弗里斯先验没有预先设定大量的假设,因此它更重视证据。特纳和施皮格尔也曾试图找到一种不提供信息的先验。“如果你想知道数据告诉你什么,而不是你之前对它的看法,那么你需要一个不提供信息的先验,”特纳说。在他们2012年的分析中,研究人员使用了三种先验,其中一种是最不提供信息的,但尽管他们意识到了杰弗里斯先验,但他们并没有使用它。

在基平的计算中,先验概率集中在他称之为参数空间的“四个角落”:生命普遍存在,智慧也普遍存在;生命普遍存在,智慧稀有;生命稀有,智慧普遍存在;以及生命稀有,智慧也稀有。在贝叶斯分析开始之前,所有四个角落的可能性都均等。

特纳同意使用杰弗里斯先验是一个重大进步。“这真的是我们拥有的最好的方法,只是为了询问数据试图告诉你什么,”他说。

基平将杰弗里斯先验与地球上生命出现和智慧的稀疏证据相结合,得到了一个后验概率分布,这使他能够计算出四个角落的新几率。例如,他发现“生命普遍存在,智慧稀有”的情景比生命和智慧都稀有的情景可能性高出九倍。即使智慧并不稀有,生命普遍存在的情景也至少有9比1的几率。基平说,这些几率不是那种可以孤注一掷的。“你很容易输掉赌注。”

不过,他说,这个计算结果“是一个积极的信号,表明生命应该存在于那里”。“至少,这是一个暗示,表明生命不是一个困难的过程。”

并非所有贝叶斯统计学家都会同意。特纳本人对结果的解读就不同。是的,基平的分析表明,生命在地球上看似早期的出现,有利于生命起源普遍存在的模型,具体几率为9:1。但特纳说,这个计算结果并不意味着这个模型比生命起源稀有的模型更有可能为真九倍,他还补充说,基平的解释“有点过于乐观了”。

特纳赞扬了基平的工作,但他认为,即使是最精细的贝叶斯分析,仍然会为宇宙中生命和智慧的稀有性留下空间。“我们对地球上生命的了解并不能排除这些可能性,”他说。

而且,可能对基平的解释有异议的不仅仅是贝叶斯统计学家。任何对生命起源问题感兴趣的人都会对声称的答案持怀疑态度,因为任何这样的分析都受制于地球上生命的地质学、地球物理学、古生物学、考古学和生物学证据——所有这些证据都不能明确生命起源和智慧出现的时间线。

哥伦比亚大学的天文学家和天体生物学家迦勒·沙夫说:“我们仍然在努力定义我们所说的生命系统是什么。”“就科学定义而言,它是一个棘手的野兽。这对于声明生命起源何时发生——甚至声明智慧的进化——都是有问题的。”

如果我们确实有严格的定义,问题仍然存在。“我们不知道生命是否开始、停止、重新开始。我们也不知道生命是否只能以一种方式构建,”沙夫说。地球何时变得适合生命居住?当它变得适合居住时,这种“生命”的第一个分子是氨基酸、RNA还是脂质膜?在生命首次出现后,它是否被地球早期历史中的一些灾难性事件扼杀,然后才以一种潜在的不同方式重新开始?沙夫说:“存在大量的不确定性。”

所有这些不可靠的证据使得即使是贝叶斯分析也很困难。但作为一种技术,它仍然是处理更多证据的最佳方法——例如,在过去火星上或在木星冰封的、含海洋的卫星之一中发现生命迹象。

沙夫说:“一旦我们有了另一个数据点可以玩,假设这种情况发生,[贝叶斯模型]是最好地利用额外数据的方法。突然之间,不确定性急剧缩小。”“我们不一定需要调查银河系中的每一颗恒星,才能弄清楚任何给定地点孕育生命的可能性有多大。再多一两个数据点,突然之间,我们就基本上了解了宇宙在产生生命或可能产生智慧方面的倾向。这相当强大。”

阿尼尔·阿南塔斯瓦米 是《物理学的边缘》(霍顿·米夫林·哈考特出版社,2010年)、《不存在的人》(达顿出版社,2015年)、《同时穿过两扇门:捕捉我们量子现实之谜的优雅实验》(达顿出版社,2018年)和《为什么机器会学习:人工智能背后的优雅数学》(达顿出版社,2024年)的作者。

更多作者文章:阿尼尔·阿南塔斯瓦米
SA Space & Physics Vol 3 Issue 5这篇文章最初以“银河系中有多少外星人?天文学家求助于统计学寻找答案”为标题发表在SA Space & Physics 第3卷第5期(
doi:10.1038/scientificamerican102020-7eYM2bpVUqs4vdcx9oHzOw
© . All rights reserved.