新型百亿亿次超级计算机每秒可进行百亿亿次计算

新型“百亿亿次”超级计算机将为科学带来突破。但这项技术也可用于研究核武器

A supercomputer resembling a row of large black metal cabinets

2022年5月30日,橡树岭国家实验室的 Frontier 超级计算机在第 59 届 TOP500 榜单中荣登世界最快计算机榜首,性能达到 1.1 百亿亿次浮点运算。该系统是首个达到百亿亿次计算性能水平的系统,这是每秒进行百亿亿次计算的阈值。

“百亿亿次”听起来像是一个科幻术语,但它有一个简单且非常非虚构的定义:人脑大约每秒可以执行一次简单的数学运算,而百亿亿次计算机可以在说“One Mississippi”的时间内至少进行百亿亿次计算。

2022 年,世界首台宣布的百亿亿次计算机 Frontier 在橡树岭国家实验室上线——它的速度是世界排名第二的计算机的 2.5 倍。不过,它很快将迎来更好的竞争对手(或同行),例如劳伦斯利弗莫尔国家实验室的 El Capitan 和阿贡国家实验室的 Aurora 等即将问世的百亿亿次级机器。

所有这些机器都位于名称以“国家实验室”结尾的机构中,这绝非巧合。这些新计算机是能源部及其国家核安全管理局 (NNSA) 的项目。能源部负责监管这些实验室以及遍布全国的其他实验室网络。NNSA 的任务是负责监督核武器储备,百亿亿次计算的部分存在理由是运行有助于维护该武器库的计算。但超级计算机的存在也是为了解决纯科学中棘手的问题


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。


当科学家完成 Frontier 的调试后,它将专门用于此类基础研究,他们希望阐明各个领域的核心真理——例如了解能量是如何产生的、元素是如何制造的以及宇宙的黑暗部分是如何促进其演化的——所有这些都通过几乎真实的模拟来实现,即使是几年前那些不容小觑的超级计算机也无法实现。

橡树岭计算和计算科学副实验室主任道格拉斯·科特说:“原则上,社区本可以更早地开发和部署百亿亿次超级计算机,但按照我们的标准,它将是不可用、无用且负担不起的。”大规模并行处理、百亿亿次能源消耗、可靠性、内存和存储等障碍,以及缺乏在这种超级计算机上启动运行的软件,都阻碍了这些标准的实现。与高性能计算行业多年的专注合作降低了这些障碍,最终满足了科学家的需求。

Frontier 的处理速度比其前代产品快七倍,内存容量是其前代产品的四倍。它由近 10,000 个 CPU 或中央处理器(为计算机执行指令,通常由集成电路制成)和近 38,000 个 GPU 或图形处理器组成。GPU 的创建是为了快速流畅地显示游戏中的视觉内容。但它们已被重新用于科学计算,部分原因是它们擅长并行处理信息。

在 Frontier 内部,这两种处理器是链接在一起的。GPU 并行执行重复的代数运算。“这使 CPU 可以更快、更高效地指导任务,”科特说。“你可以说这是超级计算领域的天作之合。”通过将科学问题分解成十亿或更多个小块,Frontier 使其处理器能够各自处理问题的一小部分。然后,科特说,“它将结果重新组合成最终答案。你可以将每个 CPU 比作工厂的车间主管,将 GPU 比作生产线上的工人。”

超级计算机中 9,472 个不同的节点(每个节点本质上都是一台不太超级的计算机)也以这样一种方式连接,它们可以快速地将信息从一个地方传递到另一个地方。但重要的是,Frontier 不仅比以前的机器运行速度更快:它还拥有更多的内存,因此可以运行更大的模拟,并将大量信息保存在处理这些数据的同一位置。这就像在您尝试进行数字填色项目时将所有丙烯酸颜料都放在您身边,而不是必须从桌子的另一侧取回每种颜色。

凭借这种强大的功能,Frontier 以及随后的巨兽可以教会人类一些以前可能不透明的世界知识。在气象学中,它可以使飓风预报不再那么模糊和令人沮丧。在化学领域,它可以试验不同的分子结构,看看哪些可能成为优秀的超导体或药物化合物。在医学领域,它已经分析了 SARS-CoV-2(导致 COVID 的病毒)的所有基因突变——将计算时间从一周缩短到一天——以了解这些调整如何影响病毒的传染性。节省的时间使科学家能够进行超快速迭代,快速连续地改变他们的想法并进行新的数字实验。

科特说,有了这种计算能力,科学家们不必像以前那样进行相同的近似。使用旧计算机,他经常不得不说,“我假设这个项无关紧要,那个项无关紧要。也许我不需要那个方程。”用物理学术语来说,这叫做制造“球形奶牛”:将复杂的现象(如牛)变成高度简化的东西(如球)。借助百亿亿次计算机,科学家们希望避免偷工减料,并将奶牛模拟成,嗯,本质上是一头奶牛:一种更接近现实表现的东西。

Frontier 升级后的硬件是实现这种改进的主要因素。但如果科学家没有能够利用该机器新功能的软件,那么仅靠硬件对科学家没有太大好处。这就是为什么一个名为百亿亿次计算项目 (ECP) 的倡议——它汇集了能源部及其国家核安全管理局以及行业合作伙伴——在超级计算机开发的同时赞助了 24 个初始科学编码项目。

这些软件计划不能只是采用旧代码——旨在模拟,例如,突发恶劣天气的出现——将其放到 Frontier 上,然后说,“它以闪电般的速度而不是几乎闪电般的速度做出了还可以的预测!”为了获得更准确的结果,他们需要一套经过增强和优化的代码。“我们不会在这里作弊,更快地获得同样不太好的答案,”科特说,他也是 ECP 的主任。

但获得更好的答案并非易事,早期科学项目 ExaSky 的负责人萨尔曼·哈比卜说。“超级计算机本质上是蛮力工具,”他说。“所以你必须以智能的方式使用它们。这就是乐趣所在,你挠头思考,‘我怎样才能真正使用这个可能很钝的工具来做我真正想做的事情?’”阿贡计算科学部门主任哈比卜希望探索宇宙的神秘构成以及宇宙结构的形成和演化。模拟模拟了暗物质和暗能量的影响,并包括了研究宇宙在大爆炸后如何膨胀的初始条件。

大规模天文调查——例如亚利桑那州的暗能量光谱仪——帮助阐明了宇宙中那些阴暗的角落,展示了星系如何在宇宙膨胀时形成、塑造和扩散自身。但是,仅靠这些望远镜的数据无法解释他们所看到的原因

不过,像 ExaSky 这样的理论和建模方法或许可以做到这一点。如果理论家怀疑暗能量表现出某种行为,或者我们对引力的概念有误,他们可以调整模拟以包含这些概念。然后它将吐出一个数字宇宙,天文学家可以看到它与他们的望远镜传感器接收到的信息相匹配或不匹配的方式。“计算机的作用是成为理论家和建模者的虚拟宇宙,”哈比卜说。

ExaSky 扩展了为较小的超级计算机编写的算法和软件,但模拟尚未导致关于宇宙黑暗成分性质的巨大突破。科学家迄今为止所做的工作提供了“能够建模但又无法真正理解它的有趣组合”,哈比卜说。不过,借助百亿亿次计算机,天文学家哈比卜可以模拟更大体积的空间,使用更像奶牛的物理学,并具有更高的清晰度。或许,理解正在路上。

另一个早期的 Frontier 项目名为 ExaStar,由劳伦斯伯克利国家实验室的丹尼尔·卡森领导,将研究另一个宇宙谜团。这项工作将模拟超新星——大质量恒星的生命终结爆炸,它们在其极端条件下产生重元素。科学家们对超新星的发生过程有一个大致的了解,但没有人真正知道这些爆炸的完整版奶牛版本,也不知道重元素是如何在其中产生的。

在过去,大多数超新星模拟都通过假设恒星是球形对称的或使用简化的物理学来简化情况。借助百亿亿次计算机,科学家可以制作更详细的三维模型。他们不仅可以运行一次爆炸的代码,还可以运行整套代码,包括不同类型的恒星和不同的物理学思想,探索哪些参数会产生天文学家在天空中实际看到的情况。

卡森说:“超新星和恒星爆炸本身就是迷人的事件。”“但它们也是宇宙故事中的关键角色。”它们提供了构成地球和我们的元素——以及向外看的望远镜。尽管它们的极端反应无法完全在物理实验中复制,但数字试验既有可能且破坏性较小。

第三个早期项目正在检查更贴近我们家园的现象:核反应堆及其反应。ExaSMR 项目将使用百亿亿次计算来弄清楚“小型模块化反应堆”(一种核电支持者希望变得更常见的设施类型)屏蔽层下方发生了什么。在早期,超级计算机一次只能模拟反应堆的一个组件。后来,他们可以模拟整台机器,但只能模拟某个时间点——例如,准确了解它何时首次启动。“现在我们正在模拟反应堆从启动到整个燃料循环过程中的演变,”橡树岭的史蒂文·汉密尔顿说,他是该项目的共同负责人。

汉密尔顿的团队将研究中子如何在核裂变链式反应中移动和影响,以及裂变产生的热量如何在系统中移动。以前根本不可能弄清楚热量如何以空间和时间细节流动,因为计算机没有足够的内存一次性完成整个模拟的数学运算。“我们接下来的重点是研究更广泛的反应堆设计”,以提高其效率和安全性,汉密尔顿说。

当然,核能一直是核反应的另一种用途:武器的另一面。在劳伦斯利弗莫尔,特蕾莎·贝利领导着一个由 150 人组成的团队,他们中的许多人正忙于准备模拟武器的代码,以便在 El Capitan 上运行。贝利是劳伦斯利弗莫尔计算物理学副项目主任,她负责监督高级模拟和计算项目的部分工作——国家安全方面的工作。来自 NNSA 实验室的团队——在 ECP 和更侧重于武器的先进技术开发和缓解计划的支持下——致力于 R&D,以帮助武器代码现代化。

询问任何科学家 Frontier、El Capitan 和 Aurora 等计算机是否终于足够好,你永远不会得到肯定的回答。研究人员总是希望获得更多更好的分析能力。并且存在外部压力来不断推进计算技术:不仅仅是为了吹嘘的权利(尽管这些权利很酷),而是因为更好的模拟可能会带来新的药物发现、新的先进材料或新的诺贝尔奖,从而使国家保持领先地位。

所有这些因素都让科学家们开始谈论“后百亿亿次”的未来——在他们每秒可以解决百亿亿次数学问题之后会发生什么。未来可能涉及量子计算机或使用更多人工智能来增强百亿亿次系统。或者可能是完全不同的东西。事实上,也许应该有人运行模拟来预测最有可能的结果或最有效的前进道路。

© . All rights reserved.