无穷范畴论提供了数学的鸟瞰视角

数学家们已将范畴论扩展到无限维度,揭示了数学概念之间的新联系

Infinity art concept composed of square blocks.

埃里克·彼得森

一个清爽的新英格兰秋日,我大学三年级的时候,走过一个地铁入口,一个数学问题吸引了我的眼球。一个男人站在他潦草地写在墙上的几个脑筋急转弯旁边,其中一个问题是用虚构的直尺和圆规构造一个体积是给定立方体两倍的立方体。

这让我停下了脚步。我以前见过这个问题。事实上,这个挑战已经有两千多年的历史了,据普鲁塔克所说,它归功于柏拉图。直尺可以用来在任何方向上延长线段,圆规可以用来以选定的中心画出任意半径的圆。这个特殊难题的症结在于,最终绘图中出现的任何点或长度都必须是在开始时就存在的,或者可以从先前提供的信息中构造出来。

要将立方体的体积翻倍,你需要从它的边长开始。这里这个值不妨设为 1,因为它是唯一给出的测量单位。为了构造更大的立方体,你必须想办法画出它的边,使其具有新的所需长度,即 ∛2(2 的立方根),仅使用直尺和圆规作为工具。


支持科学新闻业

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和思想的具有影响力的故事的未来。


这是一个难题。2000 多年来,没有人成功解决它。最终,在 1837 年,皮埃尔·洛朗·万策尔解释了为什么没有人成功,他证明了这是不可能的。他的证明使用了当时最前沿的数学,其基础是由他同时代的法国人埃瓦里斯特·伽罗瓦奠定的,伽罗瓦在 20 岁时死于一场决斗,这场决斗可能与一段不幸的恋情有关。在我自己 20 岁的黄金年龄,我取得的数学成就远不及他,但我至少理解了万策尔的证明。

这是这个想法:给定一个点作为原点和一个长度为 1 的距离,相对容易地使用直尺和圆规来构造数轴上的所有点,这些点的坐标是有理数(像数学家通常做的那样,忽略在有限时间内实际绘制无限多个点的不可能性)。

万策尔证明,如果只使用这些工具,则每个新构造的点都必须是二次多项式方程 ax2 + bx + c = 0 的解,其系数 abc 是先前构造的点之一。相比之下,点 ∛2 是三次多项式 x3 − 2 = 0 的解,而伽罗瓦的“域扩张”理论明确地证明,你永远无法通过解二次方程来获得不可约三次多项式的解,本质上是因为 2 的任何幂都不能整除数字 3。

图片来源:Matteo Farinella

有了这些事实,我就忍不住要与街上的那个人交谈。可以预见的是,我试图解释我如何知道他的问题无法解决的尝试并没有真正取得任何进展。相反,他声称我的教育让我思想封闭,无法“跳出框框思考”。最终,我的女朋友设法把我从争论中解脱出来,我们继续前行。

但一个有趣的问题仍然存在:我,一个大学三年级仍然乳臭未干的本科生,是如何在短短几周内学会自如地操作像伽罗瓦域这样的抽象数系的?这些材料出现在一门课程的末尾,课程中充满了对称群、多项式环和相关的宝藏,这些宝藏会让像艾萨克·牛顿、戈特弗里德·莱布尼茨、莱昂哈德·欧拉和卡尔·弗里德里希·高斯这样的数学巨匠感到震惊。数学家是如何快速地向每一代新的本科生传授前一代专家感到震惊的发现的?

图片来源:Matteo Farinella

部分答案与数学的最新发展有关,这些发展通过不断提高的抽象程度提供了该领域的“鸟瞰视角”。范畴论是数学的一个分支,它解释了不同的数学对象如何被认为是“相同的”。它的基本定理告诉我们,任何数学对象,无论多么复杂,都完全由其与相似对象的关系决定。通过范畴论,我们使用广泛适用于整个数学范畴的通用规则,而不是深入研究仅适用于单个领域的个别定律,来向年轻的数学家传授最新的思想。

随着数学的不断发展,数学家们对何时两个事物“相同”的意识也在扩展。在过去的几十年里,许多其他研究人员和我一直在研究范畴论的扩展,以理解这种新的扩展的唯一性概念。这些新的范畴,称为无穷范畴(∞-范畴),将范畴论扩展到无限维度。∞-范畴的语言为数学家提供了强大的工具来研究对象之间的关系过于微妙而无法在传统范畴中定义的问题。“放大到无穷”的视角提供了一种思考旧概念的新颖方式,以及发现新概念的途径。

范畴

像我认识的许多其他数学家一样,我被这个学科吸引,部分原因是我的记忆力差。这让许多人感到困惑,他们记得高中数学充满了需要记忆的公式——三角恒等式就是其中之一。但令我欣慰的是,最常用的公式可以从 sin2θ + cos2θ = 1 重新推导出来,而后者本身就有一个优雅的几何解释:它是勾股定理在斜边长为 1,锐角为 θ 度的直角三角形中的应用。

数学的这种乌托邦式的愿景,即一切都“有道理”,没有什么需要记忆,在大学层面在某种程度上瓦解了。在那个时候,学生们开始了解过去几个世纪里被设想出来的数学对象动物园。“群”、“环”和“域”属于数学的一个领域,称为代数,这个词来源于九世纪波斯数学家和天文学家穆罕默德·伊本·穆萨·花剌子米的一本书,这本书的标题有时被翻译为《还原与平衡的科学》。在接下来的千年里,代数从研究多项式方程解的性质演变为研究抽象数系。由于没有实数 x 满足方程 x2 + 1 = 0,数学家们通过添加一个虚数 i 并强制规定 i2 + 1= 0,构建了一个新的数系——现在称为复数。

代数只是数学本科课程中的科目之一。其他基石包括拓扑学——对空间的抽象研究——和分析学,它从对实函数微积分的严格处理开始,然后分支到概率空间和随机变量以及复流形和全纯函数的更奇特的领域。学生应该如何理解这一切呢?

图片来源:Matteo Farinella

数学中一个自相矛盾的想法是通过抽象来简化。正如欧金妮亚·郑在《非理性世界的逻辑艺术》中所说,“抽象的一个强大之处在于,当您忘记一些细节时,许多不同的情况会变得相同。”现代代数是在 20 世纪初创建的,当时数学家们决定统一他们对在考虑多项式方程的解或平面图形的配置中出现的许多代数结构示例的研究。为了连接对这些结构的研究,研究人员确定了描述其共同属性的“公理”。群、环和域被引入数学世界,以及数学对象可以用其拥有的属性来描述并“抽象地”探索的思想,独立于特定示例或构造的支架。

约翰·霍顿·康威曾著名地思考过数学事物的好奇本体论:“毫无疑问它们确实存在,但你无法戳和戳它们,除非通过思考它们。这非常令人惊讶,尽管我一生都是数学家,但我仍然不明白。事物怎么能在那里而不实际存在呢?”

但是,这个数学对象的世界可以在不实际存在的情况下存在,这造成了一个问题:这样的世界太大了,任何人都无法理解。即使在代数内部,也有太多数学事物需要研究,以至于没有时间理解所有事物。大约在 20 世纪之交,数学家们开始研究所谓的泛代数,指的是“集合”,它可以是对称性的集合、某个系统中的数字或完全其他的东西,以及各种运算——例如,加法和乘法——满足相关公理列表,例如结合律、交换律或分配律。通过做出不同的选择——运算是部分定义的还是完全定义的?它是可逆的吗?——人们可以得到标准的代数结构:群、环和域。但该学科不受这些选择的约束,这些选择仅代表无限可能性数组中极小的一部分。

图片来源:Matteo Farinella

新的抽象数学对象的激增带来了自身的复杂性。简化的一种方法是引入更深层次的抽象,令人惊讶的是,我们可以同时证明关于各种数学对象的定理,而无需明确说明我们正在谈论哪种对象。

范畴论是由塞缪尔·艾伦伯格和桑德斯·麦克莱恩在 20 世纪 40 年代创建的,它正是这样做的。尽管它最初是为了严格定义口语术语“自然等价”而引入的,但它也提供了一种普遍思考泛代数和数学其他领域的方式。借助艾伦伯格和麦克莱恩的语言,我们现在可以理解,每种数学对象都属于它自己的范畴这是一个指定的对象集合,以及一组描绘为对象之间箭头的变换。例如,在线性代数中,人们研究抽象向量空间,例如三维欧几里得空间。在这种情况下,相应的变换称为线性变换,并且每个变换都必须具有指定的源和目标向量空间,指示哪些类型的向量作为输入和输出出现。与函数一样,范畴中的变换可以“组合”,这意味着您可以将一个变换应用于另一个变换的结果。对于任何一对变换 f: AB (读作“f 是从 A B 的变换”)和 g: BC,范畴指定一个唯一的复合变换,写为 g ∘ f: AC (读作“g 复合 f 是从 A C 的变换”)。最后,这个组合律是结合律的,这意味着 h ∘ (g ∘ f) = (h ∘ g) ∘ f。它也是单位的:每个对象 B 都有一个“单位变换”,通常用 1B 表示,其属性是对于任何变换 g f ,只要它们的源和目标分别等于 B,g ∘ 1B = g 且 1B ∘ f = f

范畴如何帮助面对太多数学对象而没有足够时间学习所有这些对象的倒霉的本科生?您可以在泛代数中定义的任何结构类都可能与其他所有结构类不同,但这些对象所在的范畴在可以通过范畴语言精确表达的方式上非常相似。

凭借足够的经验,数学家可以知道当他们遇到一种新的代数结构时会发生什么。这个想法反映在现代教科书中,这些教科书按系列发展群、环和向量空间的理论,本质上是因为这些理论是平行的。在这些范畴与学生在拓扑学或分析学课程中遇到的范畴之间存在其他更松散的类比,这些相似之处使他们能够更快地吸收新材料。这种模式使学生能够花费更多时间探索区分各个数学子学科的特殊主题——尽管数学研究的进展通常受到先前不相关的领域之间新的和令人惊讶的类比的启发。

对称性

从具体的数学结构到公理系统,再到属于范畴的一般对象,层层递进的抽象级别提出了一个新的挑战:说一个事物与另一个事物“相同”不再非常清楚是什么意思。例如,考虑一个群,在数学中,群是对称性的抽象集合,芝加哥大学的艾米·威尔金森喜欢将群的元素描述为“移动”,这些移动翻转或旋转一个物体,然后将其放置到类似于原始位置的位置。

例如,我们可以探索 T 恤的对称性。一种对称性可以被认为是“恒等移动”,即一个人只是像通常那样穿着 T 恤。另一种对称性对应于这样的移动,即穿着者将手臂从袖孔中取出,并在 T 恤仍然绕在脖子上的情况下,将衬衫旋转 180 度,将手臂放入相对的孔中:T 恤仍然正面朝外,但现在是反向穿着。另一种对称性对应于完全脱下 T 恤,将其翻过来,然后以使每只手臂都穿过其最初所在的孔的方式重新穿上。T 恤现在是里外翻转且反向穿着。最后的对称性结合了这两个移动:与群体的典型情况不同,这些移动可以以任何顺序执行,而不会改变最终结果。这些四个移动中的每一个都算作“对称性”,因为它们导致衬衫的穿着方式与您开始时基本相同。

图片来源:Matteo Farinella

另一个群是“床垫翻转群”,它描述了床垫的对称性。除了恒等移动(当床垫保持在其原始位置时应用)之外,一个人还可以通过上下旋转床垫、前后翻转床垫或按顺序执行两个移动来移动床垫。(床垫通常不是正方形的,但如果是正方形的,则会有比此处描述的更多的对称性。)尽管 T 恤与床垫没有太多关系,但在某种意义上,这两个对称群具有相同的“形状”。首先,这两个对称群都具有相同数量的移动(在这种情况下,为四个),并且至关重要的是,您可以将 T 恤群中的每个移动与床垫翻转群中的移动配对,以便相应移动的组合也对应。换句话说,您可以匹配来自两个群的移动(将恒等移动与恒等移动匹配,将翻转与翻转匹配,将旋转与旋转匹配,依此类推)。其次,如果您从一个群中取出两个移动并按顺序执行它们,则最终位置将与按顺序执行来自另一个群的相应移动的最终结果匹配。用技术术语来说,这些群通过“同构”连接,这是一个词,其词源——来自希腊语 isos,意为“相等”,以及 morphe,意为“形式”——表明其含义。

我们可以在任何范畴中定义同构的概念,这使我们能够在数学上下文之间传递这个概念。范畴中两个对象 A B 之间的同构由一对变换给出,f: A B g: B A, 其属性是复合 g ∘ f f ∘ g 等于各自的恒等式 1A 和 1B在拓扑空间范畴中,同构的范畴概念由一对逆连续函数表示。例如,存在一个连续变形,可以使您将未烘焙的甜甜圈转换为类似咖啡杯的形状:甜甜圈孔变成把手,杯子由您用拇指按下的凹陷形成。(为了使变形是连续的,您必须在不撕裂面团的情况下进行此操作,这就是为什么在尝试实验之前不应烘焙甜甜圈的原因。)

这个例子启发了一个笑话,即拓扑学家无法区分咖啡杯和甜甜圈:作为抽象空间,这些对象是相同的。在实践中,许多拓扑学家可以说比这更不善于观察,因为通常采用更灵活的约定来处理两个空间“相同”的情况,识别任何两个仅仅是“同伦等价”的空间。这个术语指的是更奇特的空间同伦范畴中同构的概念。同伦等价是另一种类型的连续变形,但在这种情况下,您可以识别不同的点。例如,想象一下从一条裤子开始,然后缩小裤腿的长度,直到剩下丁字裤,另一个具有相同基本拓扑结构的“空间”——仍然有两个腿孔——即使最初的二维服装已缩小为一维的细绳。

图片来源:Matteo Farinella

另一个同伦等价通过“反向大爆炸”将三维欧几里得空间的无限广阔空间塌缩为一个点,其中每个点都飞回其原点,运动速度随着距初始大爆炸位置的距离而增加。

我们可以用同构事物相互替代而不会从根本上改变构造或论证性质的直觉是如此强烈,以至于事实上范畴论者重新定义了单词“the”,使其含义更接近口语英语中的“a”。例如,有一个概念称为两个集合 A B 的不交并集。与普通并集类似,不交并集 A B 具有 A 的每个元素的副本和 B 的每个元素的副本。但是,与普通并集不同,如果 A 和 B 有一个共同的元素,则不交并集 A ⨆ B 具有该元素的两个副本,其中一个副本以某种方式记住它来自 A, 而另一个副本以某种方式记住它来自 B。

有许多不同的方法可以使用集合论的公理来构造不交并集,这些方法不会产生完全相同的集合,但必然会产生同构的集合。与其浪费时间争论哪种构造是最规范的,不如将这种歧义扫到地毯下,并在要考虑满足所需普遍属性的任何特定集合时,简单地提及“the”不交并集。在另一个例子中,数学家将 T 恤对称群和床垫翻转群都称为“克莱因四元群”。

无限维范畴

一个关于范畴论基本定理起源的经常被讲述的故事是,一位名叫野田信夫的年轻数学家在 1954 年巴黎北站火车站向麦克莱恩描述了一个“引理”,或辅助定理。野田开始在站台上解释引理,并在火车离开车站前继续在火车上解释。这个引理的结果是,任何范畴中的任何对象都完全由其与其他对象的关系决定,这种关系由从该对象到其他对象或从其他对象到该对象的变换编码。因此,我们可以通过使用连续函数 f: TX 映射出其他空间 T 来表征拓扑空间 X。例如,空间 X 的点对应于连续函数 x: * → X, 其域是具有单点的空间。我们可以通过考虑映射 p: I X, 来回答空间 X 是连通的还是不连通的问题,其域是区间 I = [0,1]。每个这样的映射都定义了空间 X 中从点 p(0) 到点 p(1) 的参数化“路径”,可以将其视为蚂蚁在空间 X 周围走动时可能采取的轨迹。

我们可以使用空间的点和路径将拓扑学问题转化为代数问题:每个拓扑空间 X 都有一个关联的范畴 π1X,称为 X 的“基本群胚”。此范畴的对象是空间的点,变换是路径。如果一条路径可以在空间中变形为另一条路径,同时其端点保持固定,则两条路径定义相同的变换。这些变形,在技术上称为同伦对于路径的组合定义结合运算是必要的,这是范畴所要求的。

图片来源:Matteo Farinella

基本群胚构造的一个关键优势是它是“函子式的”,这意味着拓扑空间 X Y 之间的连续函数 f: XY 产生基本群胚 π1X 和 π1Y 之间的相应变换 π1f: π1X → π1Y。此赋值分别尊重组合和恒等式,这意味着 π1(g ∘ f) = π1g ∘ π1f 和 π1(1X) = 1π1X。这两个统称为“函子性”的属性表明,基本群捕获了关于拓扑空间的一些基本信息。特别是,如果两个空间不是同伦等价的,则它们的基本群胚必然是不等价的。

然而,基本群胚不是一个完整的不变式。它可以很容易地区分圆及其边界的实心圆盘。在圆的基本群胚中,两点之间路径的不同摆动版本可以用整数标记,这些整数记录轨迹绕圆缠绕的次数,以及分别指示顺时针或逆时针方向的 + 或 − 符号。相比之下,在圆盘的基本群胚中,任何一对点之间最多只有一个同伦路径。由充气沙滩球的外部形成的空间(拓扑术语中的球体)的基本群胚也具有此描述:任何两个点之间最多只有一个同伦路径。

图片来源:Matteo Farinella

基本群胚的最大问题是点和路径无法检测空间的更高维度结构,因为点和区间本身分别是零维和一维的。一个解决方案是也考虑来自二维圆盘的连续函数,称为同伦,以及“更高同伦”,由来自实心三维球的连续函数定义,对于 4、5、6 个或更多维度中的其他球也是如此。

自然要问,空间 X 中的点、路径、同伦和更高同伦形成什么样的代数结构:这个结构 π X (“pi 无穷 X”),称为 X 的基本 ∞-群胚,定义了 ∞-范畴的一个示例,∞-范畴是艾伦伯格和麦克莱恩首次引入的范畴的无限维类似物。像普通范畴一样,∞-范畴具有对象和可视化为一维箭头的变换,但它也包含由二维箭头、三维箭头等描绘的“更高变换”。例如,在 π X 中,对象和箭头是点和路径——不再考虑摆动——而更高维度的变换编码更高同伦。像在普通范畴中一样,任何固定维度中的箭头都可以组合:如果您有两个箭头 f: X Y g: Y Z, 则还必须有一个箭头 g ∘ f: XZ。 但是有一个问题:在试图捕获自然示例(例如空间的基本 ∞-群胚)时,组合律必须被削弱。对于任何可组合的箭头对,都必须存在一个复合箭头,但不再有唯一指定的复合箭头。

图片来源:Matteo Farinella

这种唯一性的失败使得在经典的基于集合的数学基础上定义 ∞-范畴具有挑战性,因为我们不能再将组合视为类似于泛代数中出现的运算。尽管 ∞-范畴在现代数学的许多领域(从量子场论到代数几何再到代数拓扑学)中日益重要,但它们通常被认为“太难”,除了专家之外的所有人都难以理解,并且即使在研究生级别,也未定期在课程中出现。然而,许多其他人和我将 ∞-范畴视为革命性的新方向,它可以使数学家能够梦想新的联系,否则这些联系将无法严格地陈述和证明。

现代数学术语快速指南

范畴:指定的对象集合和它们之间的变换,带有组合规则
 

组合:将一个变换应用于另一个变换的结果
 

恒等式:从对象到自身的变换,不会以任何方式更改它
 

对称性:从对象到自身的可逆变换
 

同构:可能存在于范畴中一对对象之间的“相同性”的结构概念
 

基本群胚:一个范畴,其对象是空间中的点,其变换是它们之间的路径,最多到同伦
 

同伦:通过从一条路径到另一条路径的连续变形定义的“路径之间的路径”
 

无穷范畴:范畴的无限维类似物,它添加了更高维度的变换并削弱了组合规则
 

基本无穷群胚:空间中点、路径、同伦和更高同伦的无穷范畴
 

未来的视野

然而,历史经验表明,今天最奇特的数学最终将被认为足够容易,可以在未来教给数学本科生。作为 ∞-范畴论的研究人员,推测如何简化这个学科是很有趣的。在这种情况下,有一个语言技巧——范畴“the”的超级版本——可以使 ∞-范畴像今天的普通范畴一样容易让 21 世纪后期的本科生思考。普通范畴中的关键公理是对于每对可组合的变换 f: X Y g: Y Z, 存在唯一的复合变换 g ∘ f: XZ, 从从 X Z 的变换集合的所有元素中选择。相比之下,在 ∞-范畴中,存在一个从 X Z 的箭头空间,在基本 ∞-群胚中,可以将其理解为一种“路径空间”。普通范畴中复合唯一性的正确类似物是断言在 ∞-范畴中,复合空间是“可收缩的”,这意味着它的每个点都可以通过反向大爆炸连续塌缩到单个原点。

请注意,可收缩性并不意味着存在唯一的复合:实际上,正如我们在基本 ∞-群胚中看到的那样,可能存在大量复合路径。但可收缩性保证任何两条复合路径是同伦的,连接两条复合路径的任何两个同伦都通过更高的同伦连接,依此类推。

图片来源:Matteo Farinella

这种将唯一性作为一种可收缩性条件的想法是弗拉基米尔·沃埃沃德斯基等人提出的数学新基础系统中的核心思想。世界各地的数学家正在合作开发新的基于计算机的“证明助手”,这些助手可以逐行检查数学结果的形式证明。这些证明助手具有一种机制,可以模仿常见的数学实践,即将关于一个事物的信息转移到通过显式同构或同伦等价而被理解为相同的另一个事物。在这种情况下,该机制允许用户沿着连接空间中一个点与任何其他点的路径传输涉及该点的证明,从而给出拓扑学相同性概念的严格公式。

在 1974 年的一篇文章中,数学家迈克尔·阿蒂亚写道,“理论的真正目标在很大程度上是系统地组织过去的经验,以便下一代,我们的学生和他们的学生等等,能够尽可能轻松地吸收基本方面,这是您可以持续累积地建立任何类型的科学活动而最终不会走到死胡同的唯一方法。” 范畴论可以说是现代数学中的这种角色:如果数学是类比科学,是模式研究,那么范畴论就是数学思想模式的研究——正如芝加哥艺术学院的欧金妮亚·郑所说,“数学的数学”。

今天我们可以在本科课程中涵盖如此多的内容的原因是,我们对各种数学概念的理解已通过抽象得到简化,抽象可以被认为是退后一步考虑正在考虑的特定问题并采取更广泛的数学观点的过程。从这个层面上看不到很多精细的细节——例如,数值近似,或者实际上与数字有关的任何东西——但一个显着的事实是,代数、集合论、拓扑学和代数几何中的定理有时是出于相同的基本原因而成立的,当情况如此时,这些证明是用范畴论的语言表达的。

未来的视野是什么?某些数学领域的共识是,21 世纪数学对象的自然栖息地是 ∞-范畴,就像 20 世纪数学对象的栖息地是普通范畴一样。希望在 ∞-范畴中进行深入工作所需的每个维度中令人眼花缭乱的箭头塔在某个时刻将退居集体数学潜意识的背景,每个可收缩的选择空间都塌缩为一个唯一的点。人们只能想知道:如果在 20 世纪取得了如此大的进步,那么数学在 21 世纪末会发展到什么程度?

来自我们的档案

三体问题理查德·蒙哥马利;2019 年 8 月

艾米丽·里尔 是约翰·霍普金斯大学的数学家,她在那里研究范畴论和无穷范畴的基础。她与多米尼克·维里蒂合着的书《∞-范畴论要素》将于 2022 年由剑桥大学出版社出版。

更多作者:艾米丽·里尔
大众科学杂志第 325 卷第 4 期本文最初以“无限数学”为标题发表在《大众科学杂志》第 325 卷第 4 期(),第 32 页
doi:10.1038/scientificamerican1021-32
© . All rights reserved.