IBM AI 与人类辩论——但它还不是口语界的“深蓝”

正式辩论的来回交锋仍然超出机器的“舒适区”——至少目前是这样

作者：Bret Stetka 编辑：Gary Stix

Debate champion Harish Natarajan. — 辩论冠军哈里什·纳塔拉詹在2019年2月的公司“Think 2019”会议期间，与IBM的人工智能技术进行现场辩论。

Jane Tyska *Getty Images*

2019年，哈里什·纳塔拉詹参加了一场辩论，辩论对象是一个五英尺半高的矩形电脑屏幕，观众约有800人。这台电脑是“辩论者项目”，这是IBM设计的人工智能系统。纳塔拉詹是全球公认的辩论冠军。而当时的主题是学前教育是否应该获得补贴。

根据观众投票，“辩论者项目”输掉了比赛。但这个“它”表现出色，形成了逻辑清晰的开场陈述。2018年，“辩论者项目”赢得了一场辩论，并在另一场辩论中几乎打成平手。尽管如此，该系统在与对手进行辩论和反驳时，仍然完全有可能听起来很笨拙。

虽然计算机不会很快走上政治讲台，但今天发表在《自然》杂志上的一项研究表明，这种算法正逐渐接近于参与正式论证所代表的那种复杂的人类互动。

支持科学新闻报道

如果您喜欢这篇文章，请考虑通过以下方式支持我们屡获殊荣的新闻报道订阅。通过购买订阅，您将有助于确保未来能够继续报道关于塑造我们当今世界的发现和思想的有影响力的故事。

研究人员观察到，辩论的要求超出了人工智能的“舒适区”，人工智能已经在各种棋类和视频游戏中取得了胜利——更不用说著名的问答节目了。近几十年来，人工智能领域取得了惊人的进步。1997年，IBM的“深蓝”成为第一台击败卫冕国际象棋冠军的计算机，在六局比赛中击败了泰坦级人物加里·卡斯帕罗夫。14年后，IBM的“沃森”在Jeopardy!问答节目中击败了全明星选手布拉德·鲁特和肯·詹宁斯。

但许多竞争性计算机智能已经在具有明确赢家和输家的任务或游戏中进行了测试。并且它很容易进行编码，从而形成通往胜利的明确的二元算法路径。计算机科学家一直难以实现的是一种能够与人类进行复杂对话的细微差别互动的系统。“辩论者项目”正接近这一目标。

在新的《自然》论文中，IBM的研究人员——包括该公司在以色列海法和爱尔兰都柏林的人工智能研究中心的合作团队——报告了他们系统的进展。在2019年的辩论之后，虚拟观众的15名成员对“辩论者项目”和三位人类专家辩手在近80个不同主题上的演讲进行了评估。

在这些人机对抗的比赛中，任何一方都不能访问互联网。相反，正如IBM研究院全球实验室的传播经理克里斯托弗·P·西亚卡所说，双方各有15分钟的时间“收集他们的想法”。这意味着人类辩手可以花一点时间记下关于手头主题的想法，例如学前教育补贴，而“辩论者项目”则会梳理数百万篇先前存储的报纸文章和维基百科条目，分析特定句子以及关于特定主题的共同点和分歧。准备时间结束后，双方轮流进行四分钟的演讲，然后每方进行两分钟的总结陈词。

根据观众和读者的评分，“辩论者项目”在2018年对阵三位专家之一时设法“获胜”，并且在开场陈述中得分非常高。但总的来说，它仍然略逊于人类。障碍在于保持有意义的交流，这种交流可以朝任何方向发展，类似于真正的人类对话。尽管如此，研究结果仍在推动开发能够理解和产生有意义的语言互动的人工智能系统。

“近年来，在开发能够理解和生成人类语言的算法方面已经做了大量工作，”IBM研究院的杰出工程师，自“辩论者项目”启动以来的首席研究员诺姆·斯洛尼姆说。“正在追求的任务范围从预测单个句子的情感，到更复杂的任务，例如机器翻译和对话系统。”他补充说，IBM的成果反映了一个系统，虽然仍然屈居于智人“对手”之下，但可以与对手进行互动，而这种互动在以前是其他人工智能系统无法实现的。许多这样的系统可以生成看似有意义的语言和实际的语法。但该领域的一个大问题是，机器是否能够模仿实际的人类推理或变得有意识。

“在舞台上，“辩论者项目”远非完美，它的失误揭示了辩论和辩论是多么困难——以及多么具有人类定义性，”苏格兰邓迪大学的计算机科学家克里斯·里德说，他没有参与这项研究，但出席了2019年的辩论。“[然而] “辩论者项目”的研究是创新工程的杰作……IBM团队取得的成就规模也从系统的现场表现中清晰可见：不仅使用从非常大的数据集中提取的知识，而且还即时响应人类的论述。”

纳塔拉詹和其他辩手尚未准备好向“机器霸主”承认失败。但无论是好是坏——人们希望是更好——机器学习正开始进入一个超越国际象棋和围棋既定规则的领域。