每一次在线互动都依赖于存储在远程服务器中的信息支架——而这些机器,堆叠在全球各地的数据中心,需要大量能源。国际能源署的数据显示,目前全球数据中心约占全球电力使用的1%到1.5%。而世界范围内仍在爆发式增长的人工智能热潮可能会迅速推高这个数字。
过去几个月,研究人员一直在普遍发出关于人工智能巨大能源需求的警报。但本周发表在Joule杂志上的一项同行评议分析,是首批量化正在迅速实现的需求的分析之一。人工智能能力和应用的当前趋势若持续下去,将导致英伟达到2027年每年出货150万台人工智能服务器单元。根据新的评估,这150万台全速运转的服务器每年至少消耗85.4太瓦时的电力——超过许多小国一年的用电量。
这项分析由荷兰中央银行的数据科学家、阿姆斯特丹自由大学博士候选人亚历克斯·德弗里斯进行,他在那里研究新兴技术的能源成本。此前,德弗里斯因对加密货币挖矿和交易的巨额能源成本发出警报而声名鹊起。现在,他已将注意力转向最新的技术潮流。《大众科学》与他谈论了人工智能对电力的惊人需求。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和思想的具有影响力的故事。
[以下是经过编辑和压缩的采访稿。]
您为什么认为检查人工智能的能源消耗很重要?
因为人工智能是能源密集型的。我在我的研究文章中举了一个例子:我强调,如果要将谷歌的搜索引擎完全变成类似ChatGPT的东西,并且每个人都以这种方式使用它——那么你每天将有90亿次聊天机器人互动,而不是90亿次常规搜索——那么谷歌的能源使用量将会飙升。谷歌将需要像爱尔兰一样多的电力才能运行其搜索引擎。
现在,这种情况不会发生,因为谷歌还需要投资1000亿美元用于硬件才能实现这一目标。即使[该公司]有资金投资,供应链也无法立即交付所有这些服务器。但我仍然认为,如果要在[搜索引擎等]应用程序中使用生成式人工智能,那么它有可能使每次在线互动都变得更加资源密集,这一点值得说明。
我认为,当我们谈论人工智能的风险时,至少应该将可持续性纳入其中。当我们谈论错误的潜在风险、黑盒子的未知数或人工智能歧视偏见时,我们也应该将可持续性作为一个风险因素包括在内。我希望我的文章至少能鼓励朝这个方向思考。如果我们要使用人工智能,它会有帮助吗?我们能以负责任的方式做到这一点吗?我们真的需要在第一时间使用这项技术吗?最终用户想要什么和需要什么,我们如何才能最好地帮助他们?如果人工智能是解决方案的一部分,那好吧,继续前进。但如果不是,那就不要使用它。
人工智能的哪些过程正在消耗所有这些能源?
一般来说,人工智能有两个主要阶段。一个是训练阶段,在这个阶段你设置并让模型自学如何行为。然后是推理阶段,在这个阶段你只需将模型投入实时运行,并开始向其输入提示,以便它可以产生原创响应。这两个阶段都非常耗能,我们真的不知道那里的能量比率是多少。从历史上看,对于谷歌来说,平衡是60%推理,40%训练。但后来随着ChatGPT的出现,这种情况被打破了——因为与应用模型相比,训练ChatGPT消耗的能量相对较少。
这取决于许多因素,例如这些模型中包含多少数据。我的意思是,ChatGPT驱动的这些大型语言模型以使用庞大的数据集和拥有数十亿个参数而闻名。当然,使这些模型更大是导致它们需要更多能量的因素之一——但这也是公司使其模型更强大的方式。
在考虑人工智能能源使用时,还有哪些其他变量需要考虑?
我的文章中没有包括冷却,但如果有任何数据可供参考,就会包括在内。一个很大的未知数是这些服务器最终会落在哪里。这非常重要,因为如果它们在谷歌,那么额外的冷却能源使用量将在10%的范围内增加。但全球数据中心平均会增加50%的能源成本,仅仅是为了保持机器冷却。有些数据中心的性能甚至比这还差。
您使用的硬件类型也很重要。最新的服务器比旧的服务器更高效。您要将人工智能技术用于什么也很重要。请求越复杂,服务器为满足请求而工作的时间越长,消耗的电力就越多。
在您的评估中,您概述了几种不同的能源使用情景,从最坏情况到最佳情况。哪种最有可能发生?
在最坏的情况下,如果我们决定要在人工智能上做所有事情,那么每个数据中心的能源消耗量实际上都会增加10倍。这将导致全球电力消耗量大幅爆炸式增长,因为数据中心(不包括加密货币挖矿)已经占全球电力消耗量的约1%。当然,这种情况不会发生——这根本不现实。这是一个有用的例子,说明人工智能非常耗能。
在另一方面,你有这种零增长的想法——零。有人说,需求的增长将被效率的提高完全抵消,但这是一种非常乐观的看法,没有包括我们对需求和效率的理解。每次一项主要的新技术使一个过程更高效时,实际上都会导致更多人需求正在生产的任何东西。效率提高了需求,因此最终提高效率实际上并没有节省能源。
我认为未来最有可能的道路是什么?我认为答案是人工智能相关的电力消耗将会增长。至少在最初,增长会有些缓慢。但随着服务器产量的增加,有可能在几年内加速增长。了解这一点让我们有一些时间来思考我们正在做什么。
还需要哪些额外的研究或其他步骤?
我们需要更高质量的数据。我们需要知道这些服务器的去向。我们需要知道能源本身的来源。当涉及到环境影响时,碳排放量才是我们真正关心的数字。能源需求是一回事,但它是来自可再生能源吗?还是来自化石燃料?
也许监管机构应该开始要求人工智能开发商披露能源使用情况,因为可供参考的信息实在太少了。做这项分析真的很难——目前任何试图从事人工智能工作的人都面临着同样的挑战,即信息有限。我认为,如果透明度更高,那将会有所帮助。如果这种透明度没有自然而然地到来(到目前为止还没有),那么我们应该考虑推动一下。