
以下文章经 The Conversation许可转载,The Conversation是一家报道最新研究的在线出版物。
生成式人工智能是聊天机器人和图像生成器背后的热门新技术。但它让地球变得有多热?
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您将帮助确保未来能够继续讲述关于塑造我们今天世界的发现和想法的具有影响力的故事。
作为一名 人工智能研究员,我经常担心构建人工智能模型的能源成本。人工智能越强大,所需的能源就越多。越来越强大的生成式人工智能模型的出现,对社会未来的碳足迹意味着什么?
“生成式”指的是人工智能算法生成复杂数据的能力。另一种选择是 “判别式”人工智能,它在固定数量的选项之间进行选择,并且仅生成一个数字。判别式输出的一个例子是选择是否批准贷款申请。
生成式人工智能可以创建更复杂的输出,例如句子、段落、图像甚至短视频。长期以来,它一直用于智能扬声器等应用中,以生成音频响应,或在自动完成功能中建议搜索查询。然而,它只是最近才获得了生成类似人类语言和逼真照片的能力。
使用比以往更多的电力
单个人工智能模型的精确能源成本难以估算,并且包括用于制造计算设备、创建模型以及在生产中使用模型的能源。2019年,研究人员发现,创建一个名为BERT的生成式人工智能模型(具有1.1亿个参数)消耗的能量相当于一个人乘坐跨大陆航班往返一次。参数数量指的是模型的大小,较大的模型通常更熟练。研究人员估计,创建更大的GPT-3(具有1750亿个参数)消耗了1287兆瓦时的电力,并产生了552吨二氧化碳当量,相当于123辆汽油动力乘用车行驶一年的排放量。而这仅仅是为了让模型准备好发布,在任何消费者开始使用它之前。
大小不是碳排放的唯一预测因素。开放获取的BLOOM模型由法国的BigScience项目开发,其大小与GPT-3相似,但碳足迹要低得多,在产生30吨二氧化碳当量时消耗了433兆瓦时的电力。谷歌的一项研究发现,对于相同大小的模型,使用更高效的模型架构和处理器以及更绿色的数据中心可以将碳足迹减少100到1000倍。
较大的模型在部署期间确实会使用更多能源。关于单个生成式人工智能查询的碳足迹数据有限,但一些行业人士估计它比搜索引擎查询高四到五倍。随着聊天机器人和图像生成器变得越来越流行,并且随着谷歌和微软将人工智能语言模型整合到他们的搜索引擎中,他们每天收到的查询数量可能会呈指数级增长。
用于搜索的人工智能机器人
几年前,研究实验室之外没有多少人使用像BERT或GPT这样的模型。这种情况在2022年11月30日发生了改变,当时OpenAI发布了ChatGPT。根据最新的可用数据,ChatGPT在2023年3月的访问量超过15亿次。微软将ChatGPT整合到其搜索引擎Bing中,并于2023年5月4日向所有人开放。如果聊天机器人像搜索引擎一样受欢迎,那么部署人工智能的能源成本可能会真正累积起来。但是人工智能助手除了搜索之外,还有许多其他用途,例如撰写文档、解决数学问题和创建营销活动。
另一个问题是,人工智能模型需要不断更新。例如,ChatGPT仅使用截至2021年的数据进行训练,因此它不知道此后发生的任何事情。创建ChatGPT的碳足迹不是公开信息,但很可能比GPT-3高得多。如果必须定期重新创建它以更新其知识,那么能源成本将变得更高。
一个好处是,与使用搜索引擎相比,询问聊天机器人可能是获得信息的更直接方式。您不会得到一整页的链接,而是像从人类那里获得直接答案一样,前提是准确性问题得到缓解。与搜索引擎相比,更快地获得信息可能会抵消能源使用的增加。
前进方向
未来难以预测,但大型生成式人工智能模型将长期存在,人们可能会越来越多地转向它们以获取信息。例如,如果一个学生现在需要帮助解决数学问题,他们会向导师或朋友求助,或者查阅教科书。将来,他们可能会询问聊天机器人。法律建议或医疗专业知识等其他专业知识也是如此。
虽然单个大型人工智能模型不会破坏环境,但如果一千家公司为不同目的开发略有不同的人工智能机器人,每个机器人都由数百万客户使用,那么能源使用可能会成为一个问题。需要进行更多研究以提高生成式人工智能的效率。好消息是,人工智能可以在可再生能源上运行。通过将计算转移到绿色能源更丰富的地区,或将计算安排在可再生能源更充足的时段,与使用化石燃料为主的电网相比,排放量可以减少30到40倍。
最后,社会压力可能有助于鼓励公司和研究实验室发布其人工智能模型的碳足迹,正如一些公司和研究实验室已经做的那样。将来,消费者甚至可以使用这些信息来选择“更绿色”的聊天机器人。
本文最初发表于 The Conversation。阅读 原文。
这是一篇观点和分析文章,作者或作者表达的观点不一定代表《大众科学》的观点。