世界上最无聊的数字是...

素数和2的幂次方吸引很多人并不奇怪。事实上,所有数字都可以分为两类:有趣的和无聊的

Numbers with a green background.

大众科学

最喜欢的数字是什么?对于许多人来说,它可能是一个无理数,例如 pi (π)、欧拉数 (e) 或 2 的平方根。即使在自然数(正整数)中,也有些值感觉很重要,因为我们在各种各样的语境中遇到它们:七个小矮人、七宗罪、不吉利的数字 13——以及 42,这个数字因道格拉斯·亚当斯 1979 年的小说《银河系漫游指南》而广为人知。

那么像 1,729 这样更大的值呢?这个数字当然看起来并不特别令人兴奋。它不是素数,也不是 2 的幂次方,也不是某个其他数字的平方。这些数字似乎没有遵循任何明显的模式。这就是 数学家戈弗雷·哈罗德·哈代 在 1918 年于伦敦乘坐出租车时,看到车牌号为 1729 时的想法。当时,他正要去医院拜访他生病的同事 斯里尼瓦萨·拉马努金,当他到达时,他提到了这个“无聊”的出租车号码。他告诉拉马努金,他希望这不是一个坏兆头。拉马努金立即反驳了他的朋友:“这是一个非常有趣的数字;它是可以用两种不同的方式表示为两个立方和的最小数字。”

你可能会想:有没有什么数字在某种程度上不是有趣的?这个问题很快就导致了一个悖论:如果存在一个值 n 没有令人兴奋的属性,那么这个事实本身就使它变得特别。但是,有一种方法可以相当客观地确定数字的有趣属性——令数学家们大为惊讶的是,2009 年的研究表明,自然数可以分为两个界限分明的阵营:令人兴奋的值和无聊的值。

一个全面的数字序列百科全书为研究这两个对立的类别提供了一种手段。数学家尼尔·斯隆在 20 世纪 60 年代写博士论文时就有了编写这样一部汇编的想法。他必须计算一种称为树网络的图形中值的高度,并遇到一个数字序列:0、1、8、78、944 ... 他不知道如何准确计算这个序列中的数字,并且他想知道他的同事是否已经遇到过类似的序列。但是,与对数或公式不同,没有数字序列的注册表。因此,10 年后,斯隆出版了他的第一部百科全书《整数序列手册》,其中包含约 2,400 个序列,这些序列也被证明在进行某些计算时很有用。这本书受到了巨大的赞誉。“有旧约、新约和整数序列手册,”一位热情的读者写道,据斯隆说。

在随后的几年里,斯隆的数字序列目录变得越来越大。1995 年,这位数学家与他的同事西蒙·普劳夫共同出版了《整数序列百科全书》,其中包含约 5,500 个条目。此后,该列表一直在增长。截至 2023 年 3 月,在线整数序列百科全书 (OEIS) 包含超过 360,000 个条目。任何人都可以提交——他们只需要说明序列是如何生成的以及为什么有趣,并提供示例解释前几个项。然后,审稿人检查条目,如果符合他们的标准,它就会被发布。

除了众所周知的序列,例如素数(2、3、5、7、11 ...)、2 的幂次方(2、4、8、16、32 ...)和斐波那契数列(1、1、2、3、5、8、13 ...),OEIS 目录还包含一些奇异的条目,例如用 n 个二乘四螺柱乐高积木建造稳定塔的方法数量(1、24、1,560、119,580、10,166,403 ...)和“懒惰的餐饮服务员序列”(1、2、4、7、11、16、22、29 ...),这是用 n 刀切一块馅饼可以切成的最大块数。该集合旨在客观地汇编所有序列,这使其对于研究数字的流行度非常有用——数字在列表中出现的频率越高,它就越有趣。

至少这就是运营法语科学博客 Dr. Goulu 的菲利普·古格列尔梅蒂的逻辑。在一篇文章中,古格列尔梅蒂回忆起一位数学老师声称 1,548 是一个任意数字,没有任何特殊属性。事实上,这个数字在 OEIS 目录中出现了 326 次。一个例子:它显示为“宽度为 n 的循环宇宙中规则 110 细胞自动机中单个单元的最终周期”。哈代也错了,当他说出租车号码 1729 很无聊时:1,729 在数据库中出现了 918 次(并且也经常出现在电视节目《飞出个未来》中)。

古格列尔梅蒂开始寻找真正无聊的数字:那些在 OEIS 目录中很少出现,或者像 20,067 一样,根本没有出现的数字。截至今年三月,20,067 是未出现在 OEIS 任何存储的数字序列中的最小数字。(这是因为数据库仅存储数字序列的前 180 个左右的字符;否则,每个数字都会出现在 OEIS 的正整数列表中。)20,068 只有六个条目。

来源:Philippe Guglielmetti(图形),由 Jen Christiansen 重新设计

古格列尔梅蒂继续以图形方式绘制无聊数字的序列。他发现了一片点的云,形状为一条向较大值倾斜的宽曲线。这并不令人惊讶,因为 OEIS 目录中仅存储了序列的前几项。然而,令人惊讶的是,该曲线由两个带组成,这两个带之间有一个清晰可见的间隙。这个间隙意味着任何给定的自然数在 OEIS 数据库中要么出现得特别频繁,要么极其罕见。

古格列尔梅蒂对这个结果很着迷,他转向法国里尔大学的数学家让-保罗·德拉海耶,他定期为《Pour la Science》(《大众科学》的法语合作出版物)撰稿。他想知道专家是否已经研究过这种现象。他们没有,所以德拉海耶与他在里尔的同事尼古拉斯·高夫里特和剑桥大学的赫克托·泽尼尔一起研究了这个课题。他们使用了算法信息理论的结果,该理论通过描述表达式的最短算法的长度来衡量表达式的复杂性。例如,一个任意的五位数,如 47,934,比 16,384 (214) 更难描述(“数字序列 4、7、9、3、4”)。根据信息论的一个定理,具有许多属性的数字通常也具有较低的复杂性。也就是说,在 OEIS 目录中频繁出现的值最有可能易于描述。德拉海耶、高夫里特和泽尼尔能够证明,信息论预测的自然数复杂性轨迹与古格列尔梅蒂曲线中显示的轨迹相似。但这并不能解释该曲线中被称为斯隆间隙的巨大空洞,该间隙以尼尔·斯隆的名字命名。

这三位数学家认为,该间隙源于社会因素,例如对某些数字的偏好。为了证实这一点,他们运行了所谓的蒙特卡洛模拟:他们设计了一个将自然数映射到其他自然数的函数——并且以这样一种方式进行,即小数字的输出频率高于大数字。研究人员将随机值输入到函数中,并根据其频率绘制结果图。最终产品是一条模糊的、倾斜的曲线,类似于 OEIS 目录中的数据。与信息论分析一样,没有间隙的踪迹。

为了更好地理解为什么会出现间隙,必须查看哪些数字属于哪个带。对于大约 300 以内的值,斯隆间隙不是很明显。只有对于更大的数字,间隙才会显着打开:大约 300 到 10,000 之间的所有数字中,有 18% 位于“有趣”带中,其余 82% 是“无聊”值。事实证明,有趣带包括约 95.2% 的平方数和 99.7% 的素数,以及 39% 的具有多个素因子的数字。这三类几乎占了有趣带的 88%。其余部分由具有显着属性的值组成,例如 1,111 或公式 2n + 1 和 2n– 1。

根据信息论,应该特别感兴趣的数字是那些复杂性较低的数字,这意味着它们易于表达。但是,如果数学家认为某些值比复杂度相等的其他值更令人兴奋,那么这可能会导致斯隆间隙,正如德拉海耶、高夫里特和泽尼尔所论证的那样。例如:从信息论的角度来看,2n + 1 和 2n + 2 的复杂度相同,但只有第一个公式的值在有趣带中。这些值出现在许多不同的语境中,因为它们允许研究素数。

那么,有趣和无聊数字的分裂似乎是我们做出的判断的结果,例如重视素数。如果你想在被问到你最喜欢的数字是什么时给出一个真正有创意的答案,你总是可以说“20,067”。

编者注(2023 年 9 月 26 日):在发布后编辑了“判断的差距”框,以更正图表的 y 轴。

来自我们的档案

数字游戏。 凯尔西·休斯顿-爱德华兹;2019 年 9 月。

马农·比肖夫 是一位理论物理学家,也是 Spektrum(《大众科学》的合作出版物)的编辑。

更多作者:马农·比肖夫
大众科学杂志第 328 卷第 6 期本文最初以“最无聊的数字”为标题发表于 大众科学杂志 第 328 卷第 6 期(),第 76 页
doi:10.1038/scientificamerican0623-76
© . All rights reserved.