科技巨头开放虚拟世界供人工智能程序使用

人工智能算法可以通过玩沉浸式 3D 电子游戏学到很多东西

克里斯·拉特克利夫 (Chris Ratcliffe), *彭博社*, *盖蒂图片社*

在何塞·埃尔南德斯-奥拉洛（José Hernández-Orallo）开始将其用于自己的研究之前，他就已经熟悉《我的世界》(Minecraft) 电子游戏了。这位在西班牙瓦伦西亚理工大学研究机器智能基准的计算机科学家，首先是看着自己的孩子在 3D 虚拟世界中玩耍，这个虚拟世界专注于解决问题而不是射击怪物。

2014年，微软收购了《我的世界》，其科学部门微软研究院允许自己的研究人员访问该游戏的新版本，该版本允许计算机程序以及人们探索和自定义 3D 环境。然后，在邀请包括埃尔南德斯-奥拉洛在内的一小群外部研究人员下载该世界的机器友好版本后，去年七月，微软向所有人免费提供该版本，目的是加快人工智能（AI）的进展。

现在，其他公司也纷纷效仿。12月3日，谷歌位于伦敦的部门 DeepMind 公开了自己的 3D 虚拟世界 DeepMind Lab，供外部开发人员下载和自定义。该公司最初创建这个世界是为了训练自己的人工智能程序。两天后，由企业家埃隆·马斯克 (Elon Musk) 共同创立的位于加利福尼亚州旧金山的研究公司 OpenAI 发布了一个“元平台”，使人工智能程序可以轻松地与最初为人类设计的数十款 3D 游戏以及一些网络浏览器和智能手机应用程序进行交互。

关于支持科学新闻

如果您喜欢这篇文章，请考虑订阅我们的获奖新闻，以支持我们的工作订阅。通过购买订阅，您正在帮助确保关于当今塑造我们世界的发现和想法的具有影响力的故事的未来。

所有三个版本的发布都为研究人员和软件开发人员提供了简单的方法来测试以前未见过的情况下的程序，并且让程序通过自学来导航类似现实世界场景的新颖情况来获得新技能。“像这样的环境在人工智能的未来中将发挥非常重要的作用，”西雅图华盛顿大学的机器学习研究员佩德罗·多明戈斯 (Pedro Domingos) 说。

雅达利算法

几十年来，游戏一直是人工智能的试验台，但通常情况下，算法都是按照预定义的策略进行游戏。近年来，重点已经转移到可以从自身经验中学习的机器上。2015年初，DeepMind 公布了一种算法，该算法通过反复试验，无需告知游戏目标，就教会自己如何玩经典雅达利街机游戏，而且比任何人类都玩得更好。

不过，这些游戏是简单的 2D 世界。像《我的世界》这样将玩家视觉上嵌入环境中的“第一人称”3D 电子游戏更接近现实世界，因此是更复杂的试验台。

《我的世界》使用户能够与虚拟砖块互动，并使用它们来构建结构，此外还可以导航和与预定义的结构互动。现在可供开发人员使用的版本称为 Malmo，它允许算法执行相同的操作。例如，埃尔南德斯-奥拉洛正在使用它来探索该环境是否可以用来创建机器智能的基准。算法可以竞争将砖块排列成看起来最像某个物体的样子，或者导航迷宫——测试比图灵测试更广泛的技能，图灵测试是机器智能最著名的测试，它侧重于人工智能像人类一样聊天的能力。

《我的世界》之所以能转换为人工智能试验台的一个原因是，它已经允许玩家使用短信进行交流。英国剑桥微软研究院的计算机科学家卡特娅·霍夫曼 (Katja Hofmann) 说，这可以帮助人工智能学习在现实世界中与人类协作，她领导了创建 Malmo 的团队。

机器人排练

霍夫曼说，虚拟世界对于开发最终将作为物理机器人运行的人工智能也特别有用，因为这些环境的定制成本更低，并且比现实世界中的练习更快更安全。它们还允许机器人研究人员专注于方程式的智能部分——物理机器人的机械挑战可能会分散注意力。

除了埃尔南德斯-奥拉洛，微软研究院还与少数正在使用 Malmo 项目的研究实验室合作。但霍夫曼怀疑有更多的人在使用它，可能大约有 100 个。

DeepMind Lab 类似地允许研究人员创建迷宫等结构，他们的算法可以学习收集奖励以及导航。DeepMind 还在尝试将“更自然主义的元素”（例如起伏的地形和植物）集成到平台中，一位女发言人说。现在环境已经开放，该公司希望其他研究人员将帮助使环境对算法更具挑战性。“通过开源，我们允许更广泛的研究社区参与塑造它，”她说。

OpenAI 的元平台 Universe 将事情推向了更深远的层次。通过为同一个人机智能提供多个截然不同的环境进行采样，它可以帮助解决该领域最困难的问题之一：创建可以在面对新情况时使用先前经验的算法。例如，模仿视觉皮层中脑细胞层的深度神经网络可以很快学会导航 3D 迷宫，但无法将知识转移到导航另一个迷宫。“如果你改变迷宫的颜色，系统就会完全迷失，”埃尔南德斯-奥拉洛说。“最先进的技术会惨败。”

微软现在正在努力通过 Universe 提供 Malmo。“拥有一个社区平台将加速每个人的发展，”OpenAI 的联合创始人兼首席技术官格雷格·布罗克曼 (Greg Brockman) 说。

本文经许可转载，并于2016 年 12 月 14 日首次发布。