过去几年,人们对聊天机器人如何彻底改变移动设备传递信息、实现在线购买和提供客户服务的方式议论纷纷,但这些人工智能应用程序在对话方面仍然不尽如人意。这是因为人与机器之间实现自然对话的能力——这种对话不仅仅是简单的命令和预设回复——仍然是一个正在进行的工作。然而,Facebook 希望通过创建一个共享平台来训练机器语音系统来改变这种情况。
聊天机器人——自动化的计算机程序,例如用于客户服务或作为智能手机上的个人助理——使用的对话大多是预先编写的脚本,Facebook 人工智能研究 (FAIR) 团队主管 Yann LeCun 说。“如果你偏离脚本,它们表现就不太好。” 他补充说,其他类型的聊天机器人很有趣,但对于任何特定目的来说都不是很有用,他引用了微软去年通过 Twitter 推出的 Tay AI,在它“学会”如何发布冒犯性推文后,很快就下线了。“我们现在还没有一个可以真正(学会)做一些有用的事情的聊天机器人,”LeCun 说。
LeCun 和他的团队正在通过推出一个名为 ParlAI 的共享开源人工智能训练数据和程序库,来帮助程序员开发下一代机器人。FAIR 研究科学家 Jason Weston 说,开发人工智能的主要目标之一是创建能够与人进行正常对话的智能网络。“这项技术尚未成熟,因为缺乏一些基础研究,包括开发可以训练用自然语言说话的人工智能对话算法,而不是预设的回复。”
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过 订阅 来支持我们屡获殊荣的新闻报道。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的具有影响力的故事的未来。
ParlAI 推出了 20 个不同的数据集,研究人员可以使用每个数据集来教人工智能对话系统执行特定任务,无论是帮助聊天机器人学习如何回答问题,还是收集执行任务所需的信息(例如预订餐厅)。其中一个数据集——bAbI 任务——包括 20 个不同的测试,旨在衡量例如当呈现一系列句子并被问及有关文本的问题时,人工智能应用程序如何 理解和推断含义。Weston 说,人工智能代理需要能够理解正在发生的事情并使用推理来回答问题。
一些数据集仅包含文本;另一些数据集包含图像和文本,旨在通过将单词与现实世界中的事物联系起来来教语言,LeCun 说。ParlAI 旨在为研究人员提供一个统一的框架来训练和测试对话模型,特别是同时对多个数据集进行多任务训练,他补充说。“我们希望这些任务的结合将帮助机器获得更多知识。”
麻省理工学院 计算机科学与人工智能实验室 交互机器人小组的博士后研究员 布拉德·海耶斯(他没有参与 Facebook 的工作)说,围绕机器学习和对话系统的炒作已经超过了该领域的现实。“语言理解是一个非常广泛的主题,创建功能性聊天机器人不仅需要理解语言背后的含义,还需要综合相关回应的能力。”
公开数据集将使更广泛的参与者能够解决这些问题,但海耶斯表示,更成功的语言理解和使用的发展不仅仅是将更多的训练数据输入到现有系统中。这些限制在用户必须使用简单的方式说话才能被聊天机器人和诸如 Amazon Alexa 之类的智能助手理解时最为明显。“一个很好的例子是:你可以要求 Alexa 调高或调低音量,或者将其设置为 0 到 10 之间的数字。但它不理解百分比,也无法将百分比映射回软件使用的内部比例,”他说。当程序员试图规定用户应该如何与设备交谈,而不是为更自然的交互进行设计时,这是一个危险。
Facebook 试图解决这个陷阱的一种方法是允许 ParlAI 的参与者通过让人工智能应用程序通过 Amazon Mechanical Turk 与人互动来测试其对话能力,Amazon Mechanical Turk 是一个众包平台,它利用人类智能来执行计算机目前无法执行的任务。Weston 说,最终,制作健谈的机器人和人工智能代理的能力取决于它们的设计和训练程度,这需要研究人员了解他们的程序如何与真实的人互动。
健全的聊天机器人开发策略对于该技术的发展至关重要。随着自动化聊天系统进入广泛使用,聊天机器人将对未来消息传递、支持或一线服务项目的生存至关重要,海耶斯说,但有一个重要的注意事项。“聊天机器人可以显著改进 [客户服务] 系统,并充当人类努力的倍增器,但如果过早部署,也可能破坏用户体验和品牌声誉。”