目前,世界各地数千台计算机正在数字线上进行寻宝游戏,寻找稀有的数学瑰宝。爱好者们为了寻找越来越大的素数(只能被 1 和自身整除的数),调动了大量的计算能力和算法智慧,希望能将自己的名字刻在数学史的卷轴上。
去年秋天,来自加利福尼亚州圣何塞的研究员卢克·杜兰特取得了一项新成果。杜兰特的发现取代了此前保持最大素数记录的保持者,该记录已保持了近六年之久,这在现代寻找此类数字的探索中是前所未有的长期统治。这种差距是有道理的:素数越大,它们之间的间隔就越远,使得每次新的发现都比上一次更加困难。
这个新素数包含令人难以置信的 41,024,320 位数字。为了让您对此有所概念,可观测宇宙中估计的原子数量约为 80 位数字。每增加一位数字,数字就增大 10 倍,因此新素数的大小远远超出了人类的理解能力。素数在纯数学中扮演着重要角色,它们是被称为数论领域中的主角,并且在实践中也发挥作用,例如,它们是广泛使用的加密算法的基础。一个拥有 4100 万位数字的素数不会立即加入有用数字的行列,但就目前而言,它为渴望理解庞然大物的社群增添了一份荣誉。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过 订阅来支持我们屡获殊荣的新闻报道。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
杜兰特的成功部分归功于互联网梅森素数大搜索的新颖巧妙的软件,部分归功于他个人为追求目标而调动的大型硬件和计算能力。通过组建一个跨越 17 个国家的“云超级计算机”,他结束了个人电脑发现素数的悠久传统。
即使是挥舞着强大计算机的硅赏金猎人,也很难在数字线的遥远区域发现素数。
素数通常被称为数学的基石,因为每个大于 1 的整数要么是素数,要么是素数唯一集合的乘积。例如,15 是素数 5 和 3 的乘积,而 13 不能以这种方式细分,因为 13 是素数。对这些数字的研究至少可以追溯到古希腊时期。公元前 300 年,欧几里得在他的教科书《几何原本》中证明了存在无限多个素数,从此以后,专业和业余数学家都热衷于寻找它们。
第一串素数——2、3、5、7、11 等等——很容易找到,但随着数字变得更大,任务变得更具挑战性。几千年来,人们都是手工寻找素数——直到 1951 年,计算机接管了这项搜索工作。但即使是硅赏金猎人也很难在数字线的遥远区域发现素数,因为测试一个巨大数字的素性并非易事。为了应对,研究人员部署了他们所能做到的一切优化技巧,以加快测试速度或缩小搜索范围,从而提高找到新素数的几率。
考虑数字 99,400,891。您将如何确定它是否为素数?您可以简单地将它逐个除以每个较小的数字,以查找任何除数(除了 1 和它本身)。但这对于一个相对微不足道的八位数数字来说,需要检查近 1 亿种情况。通过意识到您不需要检查直到目标数字的每个数字,只需要检查素数,您将节省大量工作。为什么?因为您只需要找到一个除数(一个可以整除 99,400,891 而没有余数的数字)。
我们知道,任何非素数除数都可以进一步分解为其素数因子——如果您的目标可以被 15 整除,那么它也可以被素数 5 和 3 整除,因此您只需要检查后者即可确定素性。更多的节省将来自这样的见解:您也不需要检查每个较小的素数——只需要检查直到 99,400,891 的平方根(当自身相乘时,得到这个八位数结果的数字)的素数。如果这些较小的素数中没有一个能整除它,那么您就可以停止查找,因为任何两个大于 99,400,891 的平方根的数字的乘积都会超过它。这些效率技巧将我们的搜索范围从大约 1 亿个数字大幅缩减到仅 1,228 个(小于 99,400,891 的平方根的素数数量)。对于那些好奇的人来说,99,400,891 = 9,967 × 9,973,所以它不是素数。
这些捷径对于一个八位数数字来说效果显著,但杜兰特是如何达到 41,024,320 位数字的呢?为了将搜索从仅仅是庞大升级到真正意义上的巨大,他和许多其他探索者专注于特定类型的素数。梅森素数,以 17 世纪研究它们的法国神学家马兰·梅森的名字命名,具有特殊的形式。您可以通过将 2 自乘若干次,然后减去 1 来得到它们,如方程 2n – 1 所述。梅森注意到,当您为 n 插入不同的值时,有时会得到一个素数。具体来说,只有当 n 是素数时,2n – 1 才能产生素数,即使这样也不能保证。
从素数猎人的角度来看,梅森素数的特殊之处在于,我们知道一种快速方法来检查 2n – 1 形式的数字是否为素数。该测试称为 Lucas-Lehmer 素性测试(以首先发现它的法国数学家爱德华·卢卡斯和证明并完善它的美国数学家德里克·亨利·莱默命名)。它比任何已知的针对没有这种特殊形式的数字的通用方法都要快得多。
Lucas-Lehmer 测试推动了互联网梅森素数大搜索项目,该项目于 1996 年启动,使任何志愿者都可以下载免费代码,他们可以在自己的计算机上运行该代码来搜索梅森素数。事实证明,众包方法和对梅森素数的关注是成功的。已知的七个最大素数都是梅森素数,并且都是由该项目的参与者发现的。请注意,肯定存在较小的未知素数,但由于我们不知道检查它们的有效方法,因此它们暂时将留在阴影中。
总而言之,项目志愿者已经发现了 18 个新的梅森素数,其中 17 个的发现归功于业余爱好者的个人电脑。杜兰特,一位 36 岁的前英伟达工程师,打破了这一连胜纪录。英伟达最近短暂超越苹果成为全球最有价值的公司,该公司设计了一种称为图形处理单元 (GPU) 的专用计算机芯片。顾名思义,GPU 最初是为加速图形渲染而发明的,但它们也很擅长其他涉及高度并行化计算的任务,在这些任务中,许多处理器同时运行以解决问题。这些问题包括训练诸如 GPT-4 之类的神经网络、挖掘加密货币,以及事实证明,搜寻素数。杜兰特通过从各种云 GPU 提供商处购买处理时间,组建了一个全球超级计算机。在其高峰期,他的项目处理的数字数量大约是参与梅森素数搜索的所有其他计算机的总和的 12 倍。
除了大型硬件之外,用于梅森素数搜索的软件自上次发现以来也获得了显著升级。用于验证梅森素数的超快 Lucas-Lehmer 测试在编程中被替换为超超快的概率素数测试。给定一个要检查的数字,后一个测试要么确认它不是素数,要么说它可能是素数。概率素数极有可能最终被证明是非素数。只有当计算机找到一个概率素数时,梅森素数搜索中的志愿者才会运行完整的 Lucas-Lehmer 测试以消除任何疑虑。
杜兰特的新素数于 10 月 11 日通过了概率素数测试。然后,在 10 月 19 日,在他开始搜索一年后,梅森素数搜索的独立测试证实,他确实在茫茫大海中捞到了一根针:2136,279,841 – 1 是已知的最大素数。
它比之前的记录保持者多出 1600 多万位数字。如果这还不足以让杜兰特获得足够的荣耀,他还发现了已知的最大“完全数”。完全数等于其除数(不包括自身)之和;6 是完全数,因为它可被 1、2 和 3 整除,并且等于 1 + 2 + 3 的总和。第二个完全数是 28。18 世纪瑞士数学家莱昂哈德·欧拉证明,每个偶完全数都可以从梅森素数生成,因此发现一个梅森素数有望在数学发现中获得一举两得的效果。
然而,这口井可能随时枯竭。我们不知道是否存在无限多个梅森素数(以及因此存在的偶完全数)。奇怪的是,我们不知道是否存在任何奇完全数,这个问题被一些人称为最古老的未解数学难题。
当在 YouTube 上的 Numberphile 访谈中被问及他的项目花费了多少钱时,杜兰特说:“我相信在 200 万美元以下。”与素数搜索项目的 3,000 美元奖金相比,这是一笔巨额投资,他计划将这笔奖金捐赠给他所就读的高中,阿拉巴马州数学与科学学院。此时,您可能会想知道为什么这么多人花费时间和金钱来寻找没有明显现实世界应用的素数。部分原因在于,他们的努力庆祝了人类的好奇心,并成为我们在数学计算方面取得进展的基准。但我认为互联网梅森素数大搜索的创始人乔治·沃尔特曼在 Numberphile 视频中被问到这个问题时说得最好:“这很有趣。”