2016年,一款名为“阿尔法围棋”的计算机因在古老而流行的策略游戏围棋中击败当时的围棋世界冠军李世乭而成为头条新闻。这款由谷歌DeepMind开发的“超人”人工智能,在与李世乭的五轮比赛中仅输了一场,这让人联想到1997年加里·卡斯帕罗夫在国际象棋比赛中输给IBM的“深蓝”。围棋涉及玩家通过移动黑白棋子(称为棋子)来对抗,目标是在棋盘上占据领地,一直被认为是机器对手更难攻克的挑战,比国际象棋更复杂。
在阿尔法围棋获胜后,人们对人工智能对人类智慧和生计的威胁进行了许多痛苦的反思,这与现在ChatGPT及其同类产品的情况非常相似。不过,在2016年输棋后的新闻发布会上,情绪低落的李世乭发表了一段带有积极意义的评论。“它的风格不同,这种不寻常的经历让我花了一些时间来适应,”他说。“阿尔法围棋让我意识到我必须更深入地研究围棋。”
当时,欧洲围棋冠军樊麾也曾在几个月前输给阿尔法围棋一场私下的五局比赛,他告诉《连线》杂志,这些比赛让他“完全不同地”看待围棋。这极大地提高了他的棋艺,以至于他的世界排名“飙升”,据《连线》杂志报道。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您将帮助确保未来能够继续报道关于塑造我们当今世界的发现和想法的重要故事。
正式跟踪人类决策的混乱过程可能很困难。但是,职业围棋棋手几十年来的棋谱记录为研究人员提供了一种评估人类对人工智能挑衅的战略反应的方法。一项新的研究现在证实,樊麾在面对阿尔法围棋挑战后取得的进步并非只是一个偶然的侥幸。2017年,在2016年那次令人感到羞辱的人工智能胜利之后,人类围棋棋手获得了详细描述人工智能系统走法的数据,并以非常人性化的方式开发了新的策略,从而提高了他们的棋艺决策质量。关于人类棋艺变化的证实出现在3月13日发表在《美国国家科学院院刊》上的研究结果中。
DeepMind首席研究科学家兼阿尔法围棋项目负责人大卫·西尔弗说:“令人惊叹的是,人类棋手如此迅速地适应并将这些新发现融入到他们自己的棋艺中。”他没有参与这项新的研究。“这些结果表明,人类将适应并在此基础上发展,从而极大地提高他们的潜力。”
为了查明超人人工智能的出现是否促使人类产生了新的棋艺策略,香港城市大学市场营销系助理教授申敏圭和他的同事使用了一个包含1950年至2021年间580万步棋谱的数据库。这个记录保存在网站Games of Go on Download上,反映了早在19世纪的围棋比赛中的每一步棋。研究人员从1950年开始分析比赛,因为那是现代围棋规则确立的年份。
为了开始梳理这580万步棋谱的庞大记录,研究团队首先创建了一种方法来评估每一步棋的决策质量。为了开发这个指标,研究人员使用了另一个人人工智能系统KataGo,将人类的每个决策的胜率与人工智能的决策的胜率进行比较。这项庞大的分析涉及模拟在580万个人类决策中的每一个决策之后,比赛可能出现的10,000种结果。
有了每个人类决策的质量评级,研究人员随后开发了一种方法来精确地确定游戏中人类决策何时是新颖的,这意味着它在围棋历史上从未被记录过。国际象棋棋手长期以来一直使用类似的方法来确定游戏中何时出现新的策略。
在围棋棋艺的新颖性分析中,研究人员绘制了每局比赛最多60步棋,并标记了何时引入新颖的走法。如果新颖的走法在某局比赛的第9步出现,而在另一局比赛中直到第15步才出现,那么前者的比赛的新颖性指数得分将高于后者。申敏圭和他的同事发现,在2017年之后,研究团队定义为新颖的大多数走法都在第35步之前出现。
然后,研究人员研究了游戏中新颖走法出现的时间是否与决策质量的提高有关——即采取此类走法是否真的提高了玩家在棋盘上的优势和获胜的可能性。他们尤其想看看,在阿尔法围棋在2016年击败人类挑战者李世乭以及在2017年击败另一系列人类挑战者之后,决策质量发生了什么变化(如果有的话)。
研究团队发现,在人工智能击败人类围棋冠军之前,人类的决策质量水平在66年里保持相当稳定。在2016-2017年的关键时期之后,决策质量评分开始攀升。人类正在做出更好的棋艺选择——可能还不足以始终如一地击败超人人工智能,但仍然更好了。
从2016-2017年之后,新颖性评分也大幅上升,因为人类在比赛序列的早期阶段引入了新的走法。在他们对新颖走法和更高质量决策之间联系的评估中,申敏圭和他的同事发现,在阿尔法围棋战胜人类棋手之前,人类的新颖走法对高质量决策的贡献平均低于非新颖走法。在这些具有里程碑意义的人工智能胜利之后,人类引入游戏的新颖走法对更好的决策质量评分的平均贡献高于已知的走法。
对这些改进的一种可能的解释是,人类记住了新的走法序列。在研究中,申敏圭和他的同事还评估了记忆能在多大程度上解释决策质量。研究人员发现,记忆不能完全解释决策质量的提高,并且“不太可能”是2016-2017年后出现的新颖性增加的根本原因。
德克萨斯大学达拉斯分校计算机科学教授穆拉特·坎塔西奥格鲁说,这些发现,加上他和其他人所做的工作,表明“显然,人工智能可以帮助提高人类的决策能力。” 坎塔西奥格鲁没有参与目前的研究,他说,人工智能处理“庞大的搜索空间”(例如围棋等复杂游戏中所有可能的走法)的能力意味着人工智能可以“找到解决问题的新方案和方法”。例如,人工智能标记医学影像提示可能患有癌症,可能会引导临床医生比以前更仔细地观察。“反过来,这将使这个人成为一名更好的医生,并防止将来犯此类错误,”他说。
坎塔西奥格鲁补充说,一个障碍是——正如世界现在在ChatGPT中看到的那样——使人工智能更值得信赖的问题。“我相信这是主要的挑战,”他说。
在这场对ChatGPT和其他人工智能的新担忧阶段,这些发现为人工智能成为盟友而不是“我们走向进步和更美好的旅程中的潜在敌人”提供了“充满希望的视角”,申敏圭和他的合著者在给《大众科学》的电子邮件中写道。
申敏圭说:“我的合著者和我目前正在进行在线实验室实验,以探索人类如何改进他们的提示,并从这些程序中获得更好的结果。”“我们不应将人工智能视为对人类智能的威胁,而应将其视为一种有价值的工具,可以增强我们的能力。”