诸如计数之类的简单数学概念似乎牢固地扎根于自然的思维过程中。研究表明,即使是非常年幼的儿童和动物也在一定程度上具备这种技能。这不足为奇,因为就进化而言,计数非常有用。例如,即使是非常简单的贸易形式也需要计数。计数还有助于估计敌对群体的大小,从而判断是进攻还是撤退更明智。
在过去的几千年里,人类发展出了一种非凡的计数概念。最初应用于少数物体,后来很容易扩展到极其不同的数量级。很快,一个数学框架就出现了,它可以用来描述巨大的数量,例如星系之间的距离或宇宙中基本粒子的数量,以及微观世界中难以想象的距离,例如原子或夸克之间的距离。
我们甚至可以使用超出目前已知与描述宇宙相关的数字。例如,数字 1010100(1 后面跟着 10100 个零,其中 10100 表示 1 后面跟着 100 个零)可以写下来并用于各种计算。然而,用普通的十进制记数法写下这个数字,将需要比宇宙中可能包含的基本粒子更多的粒子,即使每个数字只用一个粒子。物理学家估计,我们的宇宙包含少于 10100 个粒子。
支持科学新闻业
如果您喜欢这篇文章,请考虑支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您将有助于确保未来能够继续发布关于塑造我们当今世界的发现和思想的具有影响力的报道。
然而,即使是如此难以想象的巨大数字,与无限集合相比也显得微不足道,无限集合在数学中已经扮演了 100 多年的重要角色。简单地计数物体会产生自然数集合,ℕ = {0, 1, 2, 3, …},我们中的许多人在学校都遇到过。然而,即使是这个看似简单的概念也提出了一个挑战:没有最大的自然数。如果你一直数下去,你总能找到一个更大的数字。
无限集合真的存在吗?在 19 世纪,这个问题非常有争议。在哲学上,情况可能仍然如此。但在现代数学中,无限集合的存在被简单地假定为真——作为不需要证明的公理被假设。
集合论不仅仅是描述集合。正如在算术中,你学习将算术运算应用于数字——例如,加法或乘法——你也可以定义集合论运算,从给定的集合生成新的集合。你可以取并集——{1, 2} 和 {2, 3, 4} 变成 {1, 2, 3, 4}——或交集——{1, 2} 和 {2, 3, 4} 变成 {2}。更令人兴奋的是,你可以形成幂集——一个集合的所有子集的族。
比较集合的大小
对于小的集合 X,可以很容易地计算出集合 X 的幂集 P(X)。例如,{1, 2} 给出 P({1,2}) = {{}, {1}, {2}, {1, 2}}。但是对于较大的 X,P(X) 增长迅速。例如,每个 10 元素集合都有 210 = 1,024 个子集。如果你真的想挑战你的想象力,请尝试形成无限集合的幂集。例如,自然数集合 P(ℕ) 的幂集包含空集、ℕ 本身、所有偶数的集合、质数、数字之和为 2021 的所有数字的集合、{12, 17},以及更多更多。事实证明,这个幂集的元素数量超过了自然数集合中的元素数量。
要理解这意味着什么,你首先必须理解集合大小是如何定义的。对于有限的情况,你可以计数各自的元素。例如,{1, 2, 3} 和 {康托尔, 哥德尔, 科恩} 的大小相同。如果你想比较元素众多(但数量有限)的集合,有两种公认的方法。一种可能性是计数每个集合中包含的对象并比较数字。然而,有时,将一个集合的元素与另一个集合的元素匹配更容易。那么,当且仅当一个集合的每个元素都可以与另一个集合的一个元素唯一配对时(在我们的例子中:1 → 康托尔,2 → 哥德尔,3 → 科恩),两个集合的大小才相同。
这种配对方法也适用于无限集合。在这里,不是先计数然后再推导出诸如“大于”或“等于”之类的概念,而是遵循相反的策略。你首先定义两个集合 A 和 B 大小相同的含义——即,存在一个映射,将 A 的每个元素与 B 的恰好一个元素配对(因此 B 中没有元素被遗漏)。这种映射称为双射。
类似地,如果存在从 A 到 B 的映射,该映射最多使用 B 的每个元素一次,则定义 A 小于或等于 B。
在我们有了这些概念之后,集合的大小用基数或势来表示。对于有限集合,这些是通常的自然数。但对于无限集合,它们是抽象的数量,只是捕捉了“大小”的概念。例如,“可数”是自然数的基数(因此也是每个与自然数大小相同的集合的基数)。事实证明,存在不同的基数。也就是说,存在无限集合 A 和 B,它们之间没有双射。
乍一看,这种大小的定义似乎会导致矛盾,波西米亚数学家伯纳德·波尔查诺在 1851 年 posthumously 出版的《无限的悖论》中详细阐述了这些矛盾。例如,欧几里得的“整体大于部分”似乎是不言而喻的。这意味着如果集合 A 是 B 的真子集(即,A 的每个元素都在 B 中,但 B 包含额外的元素),那么 A 必须小于 B。然而,这个断言对于无限集合是不成立的!这种奇怪的性质是一些学者在 100 多年前拒绝无限集合概念的原因之一。
例如,偶数集合 E = {0, 2, 4, 6, …} 是自然数 ℕ = {0, 1, 2, …} 的真子集。直观地,你可能会认为集合 E 的大小是 ℕ 的一半。但事实上,根据我们的定义,这两个集合的大小相同,因为 E 中的每个数字 n 都可以分配给 ℕ 中的恰好一个数字(0 → 0, 2 → 1, 4 → 2, …, n → n/2, …)。
因此,集合的“大小”概念可能会被驳斥为无意义的。或者,它可以被称为其他东西:例如,基数。为了简单起见,我们将坚持传统的术语,即使它在无穷远处有出乎意料的后果。
在 1800 年代后期,现代集合论的创始人,德国逻辑学家格奥尔格·康托尔发现,并非所有无限集合都是相等的。根据他的证明,一个集合 X(有限或无限)的幂集 P(X) 总是大于 X 本身。除其他外,由此得出,没有最大的无穷大,因此也没有“所有集合的集合”。
一个未解决的假设
然而,存在类似于最小无穷大的东西:所有无限集合都大于或等于自然数。与 ℕ 大小相同的集合 X(在 ℕ 和 X 之间存在双射)称为可数集;它们的基数表示为 ℵ0,或 aleph null。对于每个无限基数 ℵa,都存在下一个更大的基数 ℵa+1。因此,最小的无限基数 ℵ0 之后是 ℵ1,然后是 ℵ2 等等。实数集合 ℝ(也称为实数轴)与 ℕ 的幂集一样大,这个基数表示为 2ℵ0,或“连续统”。
在 1870 年代,康托尔思考 ℝ 的大小是否是 ℵ0 之上的最小可能基数——换句话说,是否 ℵ1 = 2ℵ0。此前,研究过的 ℝ 的每个无限子集都被证明要么与 ℕ 一样大,要么与 ℝ 本身一样大。这导致康托尔提出了所谓的连续统假设 (CH):断言 ℝ 的大小是最小的不可数基数。几十年来,CH 让数学家们忙碌不已,但他们一直无法证明。后来,人们清楚地认识到他们的努力从一开始就注定要失败。
集合论非常强大。它可以描述几乎所有的数学概念。但它也有局限性。该领域基于 100 多年前由德国逻辑学家恩斯特·策梅洛提出的,并由他的德裔以色列同事亚伯拉罕·弗兰克尔详细阐述的公理系统。这个系统被称为 ZFC,或策梅洛-弗兰克尔集合论(C 代表“选择公理”),是一组基本假设,足以执行几乎所有的数学运算。极少有问题需要额外的假设。但在 1931 年,奥地利数学家库尔特·哥德尔认识到该系统存在一个根本缺陷:它是不完备的。也就是说,可以提出一些数学陈述,这些陈述既不能用 ZFC 证伪,也不能用 ZFC 证明。除其他外,一个系统不可能证明自身的相容性。
集合论中最著名的不可判定性例子是 CH。在 1938 年发表的一篇论文中,哥德尔证明了 CH 不能在 ZFC 中被证伪。保罗·科恩在 25 年后证明了它也不能被证明。因此,使用集合论的通常公理不可能解决 CH。因此,仍然不清楚是否存在既大于自然数又小于实数的集合。
基数不是描述集合大小的唯一概念。例如,从几何的角度来看,实数轴 ℝ、二维平面(有时称为 x-y 平面)或三维空间的子集可以被赋予长度、面积或体积。平面中形成边长为 a 和 b 的矩形的点集具有面积 a ∙ b。计算平面中更复杂子集的面积有时需要其他工具,例如学校教授的积分学。这种方法对于某些复杂集合来说是不够的。但是许多集合仍然可以使用勒贝格测度来量化,勒贝格测度是一种将长度、面积或体积分配给极其复杂物体的函数。即便如此,仍然可以定义 ℝ 或平面的子集,这些子集过于零碎,以至于根本无法测量。
在二维空间中,一条线(例如圆的周长、有限线段或直线)始终是可测量的,并且其面积为零。因此,它被称为零测集。零测集也可以在一维中定义。在实数轴上,具有两个元素的集合——例如 {3, 5}——的测度为零,而诸如 [3, 5] 之类的区间——即三到五之间的实数——的测度为二。
可忽略的集合
零测集的概念在数学中非常有用。通常,一个定理对于所有实数都不成立,但可以证明对于零测集之外的所有实数都成立。这通常足以满足大多数应用。然而,零测集可能看起来相当大。例如,实数轴内的有理数是一个零测集,即使其中有无穷多个有理数。这是因为任何可数集——或有限集——都是零测集。反之则不然:x-y 平面的具有较大基数的子集不必是可测量的,也不必具有较大的测度。例如,整个平面及其 2ℵ0 个元素具有无限测度。但是,具有相同基数的 x 轴的二维测度(或“面积”)为零,因此是平面的零测集。
这种“可忽略”的集合引发了关于 10 个无限基数大小的基本问题,这些问题长期以来一直没有得到解答。例如,数学家希望知道一个集合不成为零测集所需的最小大小。所有零测集的族用 𝒩 表示,非零测集的最小基数用 non(𝒩) 表示。由此得出,ℵ0 < non(𝒩) ≤ 2ℵ0,因为任何大小为 ℵ0 的集合都是零测集,并且整个平面的大小为 2ℵ0,并且不是零测集。因此,ℵ1 ≤ non(𝒩) ≤ 2ℵ0,因为 ℵ1 是最小的不可数基数。如果我们假设 CH,那么 non(𝒩) = 2ℵ0,因为在这种情况下,ℵ1 = 2ℵ0。
我们可以定义另一个基数 add(𝒩),来回答这个问题:使并集成为非零测集的零测集的最小数量是多少?这个数字小于或等于 non(𝒩):如果 A 是一个包含 non(𝒩) 个元素的非零测集,则 A 的所有 non(𝒩) 个单元素子集的并集是非零测集 A。但是,较少数量的零测集(尽管它们不是单元素集)也可能满足要求。因此,add(𝒩) ≤ non(𝒩) 成立。
基数 cov(𝒩) 是并集产生整个平面的零测集的最小数量。也很容易看出 add(𝒩) 小于或等于 cov(𝒩),因为如前所述,平面是非零测集。
我们还可以考虑 cof(𝒩),𝒩 的基 X 的最小可能大小。也就是说,零测集 X 的集合,它包含每个零测集 A 的超集 B。(这意味着 A 是 B 的子集。)这些无限基数——add(𝒩)、cov(𝒩)、non(𝒩) 和 cof(𝒩)——是零测集族的重要特征。
对于这四个基数特征中的每一个,都可以使用不同的“小”或“可忽略”集合的概念来定义类似的特征。另一个小概念是“稀疏”。稀疏集是包含在无处稠密集的集合的可数并集中的集合,例如平面中圆的周长,或有限或可数多个此类周长。在一维中,正规数形成实数轴上的稀疏集,而其余的实数,即非正规数,构成零测集。
因此,可以为稀疏集族定义相应的基数特征:add(ℳ)、non(ℳ)、cov(ℳ) 和 cof(ℳ)。在 CH 下,对于零测集和稀疏集,所有特征都相同,即 ℵ1。另一方面,使用科恩开发的“力迫法”,数学家肯尼斯·库宁和阿诺德·米勒在 1981 年证明,不可能在 ZFC 中证明陈述 add(𝒩) = add(ℳ)。换句话说,必须组合以产生非可忽略集合的零测集和稀疏集的数量在证明上是不相等的。
力迫法是一种构造数学宇宙的方法。数学宇宙是满足 ZFC 公理的模型。为了证明陈述 X 在 ZFC 中不是可反驳的,找到一个 ZFC 和 X 都有效的宇宙就足够了。类似地,为了证明 X 不能从 ZFC 证明,找到一个 ZFC 成立但 X 失败的宇宙就足够了。
具有惊人属性的数学宇宙
库宁和米勒使用这种方法构造了一个数学宇宙,该宇宙满足 add(𝒩) < add(ℳ)。在这个模型中,形成非可忽略集合需要比零测集更多的稀疏集。因此,不可能从 ZFC 证明 add(𝒩) ≥ add(ℳ)。
相比之下,托梅克·巴托辛斯基在三年后发现,逆不等式 add(𝒩) ≤ add(ℳ) 可以 使用 ZFC 证明。这指出了小概念的两种定义之间的不对称性。让我们注意到,如果我们假设 CH,则这种不对称性是不可见的,因为 CH 意味着 ℵ1 = add(𝒩) = add(ℳ)。
总结:add(𝒩) ≤ add(ℳ) 是可证明的,但 add(𝒩) = add(ℳ) 和 add(𝒩) < add(ℳ) 都不可证明。这与 CH 的效果相同:证明 ℵ1 ≤ 2ℵ0 是微不足道的,但 ℵ1 < 2ℵ0 和 ℵ1 = 2ℵ0 都不可证明。
除了迄今为止定义的基数之外,还有两个重要的基数特征——𝔟 和 𝔡——它们指的是实数的优势函数。对于两个连续函数(其中有 2ℵ0 个)f 和 g,如果对于所有足够大的 x,不等式 f(x) < g(x) 成立,则称 f 被 g 支配。例如,诸如 g(x) = x2 之类的二次函数总是支配线性函数,例如 f(x) = 100x + 30。
基数 𝔡 定义为足以支配每个可能的连续函数的连续函数集合的最小可能大小。
这个定义的变体给出了基数 𝔟,即族 B 的最小大小,该族 B 具有不存在支配 B 的所有函数的连续函数的属性。可以证明 ℵ1 ≤ 𝔟 ≤ 𝔡 ≤ 2ℵ0 成立。
已经证明在我们刚刚定义的 12 个无限基数之间存在几个额外的不等式。所有这些不等式都总结在西霍恩图 (Cichoń's diagram) 中,该图由英国数学家大卫·弗里姆林在 1984 年引入,并以他的波兰同事雅采克·西霍恩的名字命名。出于排版原因,小于或等于号被箭头替换。
.jpg?w=900)
来源:雅各布·凯尔纳
还有两个额外的关系:Add(ℳ) 是 𝔟 和 cov(ℳ) 中较小的一个。同样,cof(ℳ) 是 𝔡 和 non(ℳ) 中较大的一个。这两个“依赖”基数在西霍恩图中用框架标记。因此,该图包含 12 个不可数基数,其中最多 10 个可以同时不同。
无限可以有多不同?
然而,如果 CH 成立,则 ℵ1(图中最小的数字)等于 2ℵ0(图中最大的数字),因此所有条目都相等。另一方面,如果我们假设 CH 为假,那么它们可能会有很大不同。
几十年来,数学家们试图证明西霍恩图中没有一个小于或等于关系可以加强为等式。为了做到这一点,他们构造了许多不同的宇宙,在这些宇宙中,他们以各种方式将两个最小的不可数基数 ℵ1 和 ℵ2 分配给图中的条目。例如,他们创建了一个宇宙,其中 ℵ1 = add(𝒩) = cov(𝒩),ℵ2 = non(ℳ) = cof(ℳ)。
这项工作使 1980 年代的研究人员能够确认,对于每对基数,只有图中指示的关系可以在 ZFC 中证明。更准确地说,对于西霍恩图(独立的)条目的每种标记,使用值 ℵ1 和 ℵ2 来遵守图的不等式,都存在一个宇宙来实现给定的标记。
因此,我们已经知道将近四十年,ℵ1 和 ℵ2 的所有赋值给图都是可能的。但是,对于两个以上的值,我们能说什么呢?例如,所有独立的条目可以同时不同吗?一些具有三个特征的情况已经为人所知 50 年了,在 2010 年代,发现了(或构造了)更多的宇宙,其中西霍恩图中出现了多达七个不同的基数。
在我们 2019 年与耶路撒冷希伯来大学的以色列数学家萨哈龙·谢拉赫 (Saharon Shelah) 合著的论文中,我们构建了一个宇宙,其中西霍恩图中出现了最大可能数量的不同无限值——即 10 个。然而,在这样做时,我们使用了比 ZFC 更强大的公理系统,该系统假设存在“大基数”,其存在性在 ZFC 中无法证明。
虽然我们对这个结果感到非常满意,但我们并不完全满意。我们又工作了两年,试图找到仅使用 ZFC 公理的解决方案。最终,我们与谢拉赫和日本静冈大学的哥伦比亚数学家迭戈·梅希亚 (Diego Mejía) 一起成功地证明了在没有这些额外假设的情况下得到的结果。
因此,我们已经证明了实数的 10 个特征都可以不同。让我们注意,我们没有证明在 ℵ1 和连续统之间可以至少、最多或正好有 10 个无限基数。罗伯特·索洛维在 1963 年已经证明了这一点。事实上,实数集合的大小可能会有很大差异:在 ℵ1 和 2ℵ0 之间可能存在 8 个、27 个或无限多个基数——甚至不可数多个。相反,我们的结果证明,存在数学宇宙,其中 ℵ1 和 2ℵ0 之间的 10 个特定基数最终会变得不同。
这不是故事的结局。正如数学的惯例一样,许多问题仍然悬而未决,新的问题也随之出现。例如,除了此处描述的基数之外,自 1940 年代以来,还发现了许多其他位于 ℵ1 和连续统之间的无限基数。它们彼此之间的精确关系尚不清楚。区分除西霍恩图中的那些特征之外的一些特征是即将到来的挑战之一。另一个挑战是证明 10 个不同值的其他排序是可能的。与两个值 ℵ1 和 ℵ2 的情况不同,在两个值的情况下,我们知道所有可能的顺序都是一致的,但在所有 10 个值的情况下,我们只能证明两个不同顺序的一致性。所以,谁知道呢,图中可能仍然隐藏着迄今为止尚未发现的等式——涉及两个以上的特征。
本文最初发表在《Spektrum der Wissenschaft》杂志上,经许可转载。