被称为神经网络的人工智能(AI)系统可以识别图像,翻译语言,甚至可以掌握古老的围棋游戏。但是它们表示数据或变量之间复杂关系的能力有限,这使得它们无法征服需要逻辑和推理的任务。
在10月12日发表于《自然》杂志上的一篇论文中,谷歌旗下的伦敦DeepMind公司透露,它通过创建一个带有外部记忆的神经网络,朝着克服这一障碍迈出了一步。这种组合使神经网络不仅可以学习,还可以使用记忆来存储和回忆事实,从而像传统算法一样进行推断。反过来,这使其能够解决诸如在没有任何先验知识的情况下导航伦敦地铁以及解决逻辑难题之类的问题。尽管解决这些问题对于经过编程的算法来说并不令人印象深刻,但该混合系统在没有任何预定义规则的情况下设法完成了这项任务。
尽管这种方法并非全新——DeepMind本身在2014年的一篇预印本中就报告了尝试过类似的壮举——但“这篇论文中取得的进展是显著的”,加拿大蒙特利尔大学的计算机科学家Yoshua Bengio说。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的有影响力的故事的未来。
记忆魔法
神经网络通过加强虚拟类神经元单元之间的连接来学习。如果没有记忆,这样的网络可能需要看到特定的伦敦地铁地图数千次才能学会导航地铁的最佳方法。
DeepMind的新系统——他们称之为“可微神经计算机”——可以理解它以前从未见过的地图。它首先在随机生成的类似地图的结构(可以表示由线路连接的站点或其他关系)上训练其神经网络,在此过程中学习如何将这些关系的描述存储在其外部记忆中,并回答有关这些关系的问题。当面对一张新地图时,DeepMind系统可以将这些新的关系——论文中的一个例子是地铁站之间的连接——写入记忆,并回忆起它来规划路线。
DeepMind的人工智能系统使用相同的技术来解决需要推理的难题。在接受了20种不同类型的问答问题的训练后,它学会了进行准确的推论。例如,该系统正确推断出球在操场上,因为它被告知“约翰捡起了足球”和“约翰在操场上”。它正确解决了96%以上的问题。该系统的表现优于“循环神经网络”,后者也有记忆,但该记忆位于网络本身的结构中,因此不如外部记忆灵活。
尽管DeepMind的技术仅在人工问题上证明了其自身价值,但它可以应用于从大量数据中进行推论的实际任务。DeepMind的计算机科学家,该论文的合著者Alex Graves说,这可以解决答案未在数据集中明确说明的问题。例如,要确定两个人是否在同一时间住在同一个国家,该系统可能会从他们各自的维基百科页面中整理事实。
尽管DeepMind人工智能解决的难题很简单,但Bengio认为该论文是一个信号,表明神经网络正在超越单纯的模式识别,朝着诸如推理之类的人类水平任务迈进。“如果我们想要接近人类水平的人工智能,这种扩展非常重要。”
本文经许可转载,于2016年10月13日首次发表。