分析和生成文本的人工智能程序正在改变我们阅读和学习的方式。为了解析写作,人工智能模型会搜寻文本线索,例如词语选择,以了解它们之间的联系。但是,当这些线索被故意模糊和令人困惑时会发生什么?当我挑战人工智能开发者解决近百年前的《凯恩的下巴骨》,一本1934年的谋杀谜题书时,我试图回答这个问题。
这本书神秘地进入了我的生活,就像一个文学侦探所希望的那样。2022年10月的一个下午,一个来自亚马逊的随机包裹被扔到了我的家门口,没有附带任何便条或退货地址。我从未听说过里面的这本书,但谷歌搜索告诉我,《凯恩的下巴骨》既是一部谋杀悬疑小说,又是一个令人绞尽脑汁的谜题。这本书出版时故意将所有页面都弄乱了;为了破解案件,读者必须首先重新排列页面,然后说出六名凶手及其受害者的名字。
这个邪恶情节的作者是(惊喜惊喜)一位谜题专家。爱德华·马瑟斯曾以笔名托奎玛达为《观察家报》编制纵横字谜。他在侦探小说所谓的黄金时代的高峰期出版了《凯恩的下巴骨》,但只有两个人成功破解了它,之后这本书就绝版了。2019年,出版平台Unbound Publishing的联合创始人约翰·米钦森在英国的一家文学博物馆偶然发现了一本故事副本及其解答。米钦森决定重印这本100页的谜题。“我说,‘哇,这太棒了。这是一部侦探小说,那么把它整理好会有多难呢?’”他回忆道。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和思想的有影响力的故事。
事实证明,答案是“非常非常困难”。在过去的几年里,只有另外四个人解开了这个谜题。然后这本书在TikToker的帮助下爆红,他们试图用一面色彩缤纷的“谋杀墙”重新排列页面。它的新流行促使米钦森在最初的5000册印刷基础上加印了更多副本。
当我的《凯恩的下巴骨》副本出现时,我们没有为这些页面指定墙面空间,而是将它们铺在了我们家的客床上。在一个昏暗的夜晚,当我们仔细研究那些华丽而又故意模糊的语言时,我建议使用人工智能算法来解决这部小说。

尝试解决《凯恩的下巴骨》。图片来源:奥斯汀·休斯
因为我不是软件专家,所以我开始寻找一家愿意解决这个谜题的人工智能公司。但是大多数人工智能都没有经过专门训练来重新排列书页,或者分析20世纪30年代英语的语言怪癖。最后,我联系了Zindi,这是一家总部位于非洲的公司,该公司举办人工智能竞赛,5万名数据科学家使用算法来解决谜题并赢得奖品。Zindi对举办比赛很感兴趣,在Unbound的许可下,我创建了2022年凯恩的下巴骨谋杀谜题竞赛;我们将这本90年前的书数字化,并挑战世界使用自然语言处理(NLP)算法来重新排列页面。
自然语言处理算法,例如著名的ChatGPT,试图通过将其上下文和语言与接收到的训练数据进行比较来理解文本中的信息。这些算法可以通过将每个单词转换为“标记”,然后分析每个标记如何融入完整作品中,来分析从未见过的文本。这有助于人工智能算法快速有效地分析文本,无论是文学作品还是科学报告。我高尚地抵制了使用人工智能来破解是谁寄给我这本有趣的书的谜题,而是给朋友发短信并在Instagram上发帖来找出罪魁祸首。
对于我们的比赛,参与者从谷歌开发的现有NLP模型BERT开始,该模型在开源库中可用,可以在其中针对特定用途进行修改。“这些模型……在模型创建者可以获得的大量数据上进行训练,然后进行改进以遵循一组特定的指令,”南加州大学计算机科学研究副教授乔纳森·梅说。为了改进他们的模型以用于这种特定用途,我们给参与者提供了阿加莎·克里斯蒂的第一部侦探小说《斯泰尔斯庄园奇案》,作为训练数据使用,因为这个故事与《凯恩的下巴骨》写于同一时期,包含类似的语言,并展示了经典谜题的语境线索。
人工智能与创作小说,包括谋杀悬疑小说,有着悠久的历史。1973年,计算机科学家谢尔顿·克莱因提出了自动小说作家,他声称该程序可以在不到20秒的时间内创作出2100字的谋杀悬疑故事。从那时起,程序员和工程师使用更多的数据改进了这些模型的输出。“在某种程度上,谋杀悬疑小说很容易,”英国开放大学教育技术研究所名誉教育技术教授迈克·夏普尔斯说。“它有一个标准的故事情节结构:找到尸体,侦探来了,你得到了一个障眼法,等等。”这种故事情节结构不仅对匆忙创作故事的作者有帮助,而且还可以帮助人工智能语言程序尝试将这些故事的乱序页面放回正确的顺序——理论上是这样。
不幸的是,《凯恩的下巴骨》为语言分析算法创造了终极挑战:故事不仅完全乱序,而且旨在难倒读者。例如,语言高度风格化——米钦森将其描述为“后现代主义诗歌”——并且故意模糊,以使页面排序尽可能困难。此外,故事中充斥着虚假线索,例如某些角色的假名和其他角色的误导性名称,所有这些都可能使人工智能模型以及人类解谜者感到困惑。结果,没有一位人工智能开发者成功破解了这个谜题——尽管他们中的一些人取得了一些进展。
来自南非的计量经济学家M.G.费雷拉是人工智能竞赛的获胜者之一,他的得分最高,为42分。这意味着他的程序正确排列了Unbound允许我们用于比赛的70页中的42页。“自然语言处理确实具有一定的理解能力,比如知道雷声和雨水是相关的,”费雷拉说。“但这里的问题是,这本书试图用虚假线索来迷惑你。它打破了自然语言处理的理解能力。”为了解决这个谜题,他解释说,人工智能需要人类介入,查看上下文并识别哪些想法是相关的。“朝着这个方向发展,最终我们将能够解决整个问题。但是到那时,自然语言处理将只占很小一部分,而人类的叠加将占很大一部分,我会称之为机器辅助,”他补充道。*
谋杀谜题竞赛揭示,当前的人工智能语言程序可能能够完成令人印象深刻的壮举,但它们不会很快与波洛正面交锋。这些模型不擅长分析没有上下文的事物,这可能会给希望使用自然语言处理来分析古代语言的研究人员带来问题。由于关于一些早已消失的文明的历史记录很少,缺乏上下文使得人工智能很难学习如何翻译他们失落的语言。
至少这次经历帮助我解决了一个谜题:我追踪到了寄给我这本书并让我开始解决这个谜题的人。罪魁祸首原来是我小学时代的朋友之一,一个没有社交媒体但确实对谋杀悬疑小说有偏爱的人——就像我一样。
这是一篇观点和分析文章,作者或作者表达的观点不一定代表《大众科学》的观点。
*编者注(8/31/23):此段落已在发布后编辑,以更正对《凯恩的下巴骨谋杀谜题竞赛》中使用的页数的描述。
本文的标题为“谋杀谜题”,经过改编后收录在2023年11月刊的《大众科学》杂志中。