人工智能天气预报尚不能取代人类

GraphCast 和其他基于人工智能的预报工具提供了一种全新的天气预测方式，但它们也有局限性

Satellite image of the sun rising over the east coast of the United States and Canada as Hurricane Lee approaches Nova Scotia on September 15, 2023 — 飓风李的阳光升起，从纽约市到缅因州都投下了相当大的阴影。

CSU/CIRA & NOAA

去年九月中旬，当飓风李在百慕大以西向北弯曲时，预报员们正忙于查阅天气模型和飓风探测飞机的资料，以评估这场危险的风暴可能在何处登陆：新英格兰或更东边的加拿大。气象学家越早这样做，他们就能越早警告那些处于破坏性阵风、猛烈风暴潮和暴雨路径中的人们。在登陆前六天，很明显李将沿着向东的路径前进，并据此发布了警告。但另一种工具——一种名为 GraphCast 的实验性人工智能模型——在预报员的传统模型之前整整三天就准确地预测了这一结果。

GraphCast 的预测展示了人工智能在改进天气预报方面的潜力——它可以更快地创建预报，而且计算能力更低。但它是否预示着该领域真正的变革，或者仅仅会成为人类预报员用来确定风向的众多工具之一，目前仍悬而未决。

GraphCast 由 Google DeepMind 开发，是近年来发布的几个人工智能天气模型中最新的一个。谷歌的 MetNet 于 2020 年首次推出，已经应用于该公司天气应用程序中的“即时预报”等产品中，NVIDIA 和华为也都开发了自己的 AI 天气模型。所有这些模型都被标榜为具有与最佳非 AI 预报计算机模型相当或更高的准确性，并在气象学领域引起了轰动，其中 GraphCast 引起的轰动最为显着。“它确实产生了很大的影响，”欧洲中期天气预报中心 (ECMWF) 的机器学习科学家 Mariana Clare 说。ECMWF 是一个独立的政府间组织，为 35 个国家发布预报，并拥有许多专家认为最好的天气预报模型之一。

支持科学新闻报道

如果您喜欢这篇文章，请考虑通过以下方式支持我们屡获殊荣的新闻报道订阅。通过购买订阅，您正在帮助确保有关当今塑造我们世界的发现和思想的具有影响力的故事的未来。

在飓风李来临之前，DeepMind 研究团队通过向 GraphCast 输送历史天气数据来测试其性能，以查看它是否能准确“预测”发生的事情。2023 年 11 月发表在《科学》杂志上的研究结果表明，在 90% 的测试案例中，人工智能的性能与黄金标准 ECMWF 的集成预报系统 (IFS) 相当甚至更好。但看到 GraphCast 在飓风李的实时工作中发挥作用，尤其让其创造者之一、谷歌 DeepMind 的研究科学家 Rémi Lam 感到震惊。Lam 说，李的预测和其他一些实时预报是“对该系统实际运行的真实确认”。

人工智能的工作方式与传统的预报模型截然不同。后者是旨在捕捉大气混乱物理现象的复杂方程网络。它们被输入来自世界各地的气象气球和气象站的数据，并利用这些数据来预测天气将如何随着各种气团和其他大气特征的相互作用而展开。预报员通常运行多个此类模型，然后将结果信息——通过他们自己对当地地理环境以及每个模型的优势和劣势的专家知识进行过滤——整合到连贯的预测中。

相比之下，GraphCast 和大多数其他新的人工智能工具放弃了理解和以数学方式复制真实世界物理现象的努力（尽管 NVIDIA 的 FourCastNet 是一个例外）。相反，人工智能工具是统计模型：它们识别由数十年观测天气记录和从物理预报中收集的信息组成的训练数据集中的模式。因此，这些模型可能会注意到某天的天气设置与过去发生的类似事件相似，并根据该模式进行预报。

亚利桑那大学大气科学和水文学副教授 Kim Wood 说，由于人工智能模型依赖于过去的数据，因此大多数人工智能模型可能不太擅长预测罕见和前所未有的事件。此类事件包括飓风哈维，它在 2017 年在德克萨斯州部分地区降下了前所未有的 60 英寸降雨，以及飓风奥蒂斯异常迅速增强，从热带风暴升级为 5 级怪物，就在去年袭击墨西哥太平洋海岸之前。“它在[训练数据中]最常看到的事件，它最擅长捕捉。因此，平均而言，它可能相当不错，”Wood 说。“但是，可能永远改变人们生活的事件——它可能会更难应对。”Wood 指出，随着气候变化，这些“罕见”事件变得越来越普遍，因此准确捕捉和预测它们变得越来越重要。

ECMWF 的 Clare 和 Google DeepMind 的 Lam 都表示，GraphCast 似乎也不太擅长预测风暴和降雨强度。这可能是因为该模型的分辨率相对较低；它以 28 平方公里的区块观察世界，而阵风和暴雨发生在城市街区和社区的尺度上。“肯定有改进的空间，”Lam 说，但为了获得更高分辨率的 AI 模型，他和他的同事需要编译更多更高分辨率的训练数据——要多得多。他补充说，这是一个挑战，但可能并非无法克服。

尽管 AI 模型确实可以在几分钟内吐出一个预报，而物理模型完成一次由超级计算机驱动的运行需要两到三个小时，但无法确定 AI 究竟是如何得出其预报的。与物理模型不同，GraphCast 和其他类似的预报工具是“不可解释的”。这意味着结果无法轻易追溯到构成这些模型的数千万个参数。“当模型出错时，我希望能够查看细节并找出原因，”北达科他大学大气科学副教授 Aaron Kennedy 说。例如，ECMWF 模型著名地预测飓风桑迪将作为一场强风暴转向美国海岸，而美国国家海洋和大气管理局 (NOAA) 使用的预报模型却没有预测到。预报员能够深入研究这两个模型，并确定 ECMWF 模型更好地表示了桑迪的旋转。

能源公司 Cheniere Energy 的气象学家兼休斯顿极端天气网站 The Eyewall 的联合创始人 Matt Lanza 同意理解错误是有价值的——在某种程度上。“在某种程度上，这是一个问题。人工智能的[黑匣子]性质将成为该领域一些人接受它作为有用的事物之一的障碍，”他说。“我们不能盲目信任模型......，但我们正处于这个过程的早期，并且会有更多的研究来理解它，”Lanza 补充道。“我认为答案最终会出现。”他渴望看到人工智能模型能做什么。

Clare 说，GraphCast 节省的时间和计算能力可以使那些缺乏超级计算机访问权限（以及大型人类预报员团队）的公司和机构更容易进行天气建模。目前，只有少数政府预报机构生成大部分天气预报，因为它们是唯一有能力这样做的组织。

一个更具体的挑战是，GraphCast 现在只能生成所谓的确定性预报：一个单一的预测，没有给出实际发生的可能性概率。Clare 说，GraphCast 的每次运行，在给定一组参数的情况下，都会产生类似的输出——因此它不能轻易地用于创建一系列预报可能性。这与传统的物理集合预报不同，后者接受大气固有的随机性。美国国家气象局 (NWS) 天气预报中心（NOAA 的一部分）的预报业务主管 Greg Carbin 将现有天气模型预报的轨迹比作漂浮在河流上的软木塞。即使您每次都小心地将相同的软木塞放在相同的起点，它们向下游的路径也会有所不同。软木塞移动的时间越长，它们最终彼此之间的距离就越远。“天气预报是不确定的，因为天气系统存在不确定性，”Clare 解释说。目前 GraphCast 无法捕捉到这一点。Lam 说，他和他的同事正在努力将概率构建到该模型的未来版本中。

然而，即使 GraphCast 变得具有概率性——甚至即使该模型的分辨率得到提高，并且人工智能在降雨和风暴强度预报方面变得更加准确——建模仍然只是天气预报流程中的一个组成部分，NWS 高级建模系统顾问 Hendrik Tolman 说。预报的第一步是通过传感器收集有关世界状况的数据。第二步是将所有这些观测结果整合到参数中，以输入模型。然后是建模，最后是将预报转化为公众信息的过程。Tolman 说，为气象学的单个组成部分开发捷径并不能消除对专家人员的需求，他们仍然需要收集、传递和解释从一个步骤到下一步的信息。

与大众科学交谈的每位专家都将 GraphCast 和其他 AI 模型描述为他们工具包中的附加工具。如果 AI 可以快速且廉价地生成准确的预报，那么没有理由不开始将其与现有方法一起使用。事实上，ECMWF 一直在其网站上发布 GraphCast 预报以及其他 AI 和实验性模型的预报，并且正在开发自己的 AI 预报模型。同样，NOAA 研究人员一直在评估是否以及如何将 GraphCast 纳入其集合预报中。

但是，在未来五到十年内，人工智能模型是否会取代物理模型——以及人类——的世界？预测表明这种可能性很小。