谷歌的在线翻译服务谷歌翻译很快将使用一种完全基于深度学习的新算法,该公司在9月27日宣布。 该算法也在发表在预印本服务器 arXiv 上的一篇论文中进行了描述,它是第一个广泛可用的、用于翻译语言的计算机系统,依赖于日益流行的 AI 技术。 谷歌计算机科学家表示,与该公司现有的服务相比,该算法将错误率降低了约 60%。
一种使用该算法的中文到英文翻译服务现在正在谷歌翻译的移动和网络应用程序上使用,谷歌表示将在未来几个月内推出其他语言。
这项进步是深度学习成功的又一个例子,近年来,它通过将人工神经网络(模仿大脑中神经元连接方式的计算单元层)与庞大的数据集相结合,帮助解决了重大的 AI 问题。 最值得注意的是,该技术在图像识别和游戏方面击败了其他机器方法。 谷歌现在将相同的方法应用于语言翻译,创建了所谓的神经机器翻译系统 (NMTS)。 “从输入到输出,全部由一个神经网络完成,”位于加利福尼亚州山景城的谷歌计算机科学家 Quoc Le 说,他帮助开发了 NMTS。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。 通过购买订阅,您将有助于确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。
NMTS 借鉴了其他人在机器学习方面的进展,并添加了一些方法论上的新颖之处,加拿大蒙特利尔大学的计算机科学家 Yoshua Bengio 说,他读过 arXiv 的论文。 “乍一看,他们似乎已经掌握了大部分已知技巧,”他说。 该团队的主要成就是证明“通过可靠的工程和精心设计的架构,神经机器翻译可以远远超过机器翻译的经典方法”,他说,并取得了“相当惊人的结果”。
瑞士卢加诺大学(也称为 USI)的计算机科学家 Jürgen Schmidhuber 说,该算法“在许多方面确实改进了最先进的技术”。
机器翻译
公司发言人 Charina Choi 说,到目前为止,谷歌翻译对人工神经网络的使用是有限的。 在大多数情况下,其算法逐字分析文本,通过搜索数百万现有翻译(例如来自联合国或欧洲议会的文件)来学习关联不同语言中的对应单词。
NMTS 还通过分析现有翻译来学习; 在此过程中,它会调整人工神经元之间的连接,从而提高其性能。 但它会通过首先将每个单词分解为“词段”来分析句子,这个想法来自该团队成员 Mike Schuster,他也在山景城的谷歌工作,他将其应用于语音识别软件。
“不知何故,在神经网络内部的某种表示中,这些词段可以组合起来表示含义,”Le 说。 这可能类似于神经网络执行诸如人脸识别之类的视觉任务的方式:它们从图像中的单个像素开始,然后逐渐处理更复杂的特征,例如边缘、几何图案等等。
分析文本的同一个神经网络会生成翻译。 为了提高速度,该公司在专门为机器学习设计的计算机芯片上运行该系统。 今年早些时候,在围棋比赛中击败顶尖人类棋手的程序 AlphaGo 使用了类似的硬件。
性能评估
为了评估翻译系统的性能,谷歌研究人员从维基百科和新闻文章中提取句子,并将 NMTS 制作的翻译(在少数不同的语言对之间)与公司旧系统和人工翻译制作的相应翻译并排比较。 然后,该团队让人工评估员在盲测中对翻译质量进行评分。
众所周知,中文到英文的翻译非常困难,显示出显着改进,但与该算法在印欧语言之间的翻译相比仍然滞后。 对于其他一些语言对,NMTS 的准确性接近人工翻译的水平,尽管作者警告说,该测试的意义受到精心制作的简单句子样本的限制。
Schmidhuber 认为,只有当机器能够结合不同的感官输入时,它们才能真正与人类的翻译水平相匹配或超越人类。 “今天,他们只看到诸如‘猫从树上掉下来’之类的句子,”Schmidhuber 说。 “未来,他们还将看到猫从树上掉下来的视频,他们将控制能够看到、听到、移动和操纵物体的机器人,并通过疼痛传感器感受疼痛,并将他们的经历与文本联系起来。”
本文经许可转载,并于 2016 年 9 月 27 日首次发布。