人工智能技术首次解读维苏威火山灰烬中古卷

机器学习技术首次揭示了脆弱的卷轴状莎草纸CT扫描图像中的希腊单词

Charred scrolls from Herculaneum with red laser light

赫库兰尼姆的焦化卷轴不易打开,但X射线扫描可以揭示其内容。

一位21岁的计算机科学专业的学生赢得了一项全球竞赛,成功解读了来自古罗马城市赫库兰尼姆的碳化卷轴中的第一段文字。自公元79年的一次火山爆发以来,该卷轴一直无法解读——那次火山爆发也掩埋了附近的庞贝古城。这项突破可能会开启来自希腊罗马古代唯一完整图书馆的数百篇文献。

内布拉斯加大学林肯分校的卢克·法里托开发了一种机器学习算法,该算法已在卷轴状莎草纸的几行上检测到希腊字母,包括 πορϕυρας (porphyras),意思是“紫色”。法里托利用表面纹理中细微的小尺度差异来训练他的神经网络并突出显示墨迹。

意大利那不勒斯大学的纸莎草学家,也是审查法里托研究成果的学术委员会成员费德里卡·尼科拉迪说:“当我看到第一张图像时,我震惊了。”她说,“这真是一个梦想。” 现在,“我真的可以从卷轴内部看到一些东西了。”


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


公元79年10月,维苏威火山爆发,赫库兰尼姆被20米厚的火山灰掩埋,数百个卷轴被埋没。早期打开纸莎草纸的尝试造成了大量的碎片,学者们担心剩下的部分可能永远无法展开或阅读。“这些都是非常疯狂的东西。它们都皱巴巴的,而且被压碎了,”尼科拉迪说。

维苏威挑战赛提供了一系列奖项,最终大奖为70万美元,奖励解读卷轴中四个或更多段落的人。10月12日,组织者宣布法里托因在纸莎草纸4平方厘米的区域内解读了超过10个字符而赢得了4万美元的“首批字母”奖。柏林自由大学的研究生优素福·纳德获得第二名,奖金为1万美元。

豪华图书馆

威尼斯卡福斯卡里大学的古希腊罗马历史学家西娅·索默斯基尔德说,最终能看到卷轴内部的字母和单词“非常令人兴奋”。这些卷轴是在十八世纪被发现的,当时工人们偶然发现了一座豪华别墅的遗迹,这座别墅可能属于朱利叶斯·凯撒岳父的家族。索默斯基尔德说,解读这些纸莎草纸可能会“彻底改变我们对古代历史和文学的认识”。今天已知的大多数古典文本都是几个世纪以来抄写员反复抄写的结果。相比之下,赫库兰尼姆图书馆收录了来自作者本人的、任何其他来源都不知道的作品。

到目前为止,研究人员只能研究打开的碎片。已经鉴定出一些拉丁文作品,但其中大多数包含与伊壁鸠鲁哲学学派相关的希腊文本。其中有伊壁鸠鲁本人撰写的《论自然》的部分内容,以及鲜为人知的哲学家费洛德姆斯关于恶习、音乐、修辞和死亡等主题的作品。有人认为,该图书馆可能曾经是他的工作收藏。但是,超过600个卷轴——大部分保存在那不勒斯国家图书馆,少数在英国和法国——仍然完好无损且未打开。并且在别墅的较低楼层可能还会发现更多的纸莎草纸,这些楼层尚未挖掘出来。

计算机科学家布伦特·西尔斯帮助设立了维苏威挑战赛,他的团队花费多年时间开发方法,使用X射线计算机断层扫描 (CT) 扫描“虚拟展开”薄如蝉翼的图层,并将它们可视化为一系列平面图像。2016年,在肯塔基州列克星敦的肯塔基大学的西尔斯报告说,他使用该技术解读了来自以色列恩戈地的焦化卷轴,揭示了用三世纪或四世纪公元写的《利未记》的部分内容——犹太教《妥拉》和基督教《旧约》的一部分。但是恩戈地卷轴上的墨水含有金属,因此在CT扫描中会发出明亮的光芒。较旧的赫库兰尼姆卷轴上的墨水是碳基的,本质上是木炭和水,在扫描中与莎草纸具有相同的密度,因此根本不会显示出来。

西尔斯意识到,即使亮度没有差异,CT扫描也可能捕捉到微小的纹理差异,从而区分覆盖墨水的莎草纸区域。为了证明这一点,他训练了一个人工神经网络来读取打开的赫库兰尼姆碎片X射线图像中的字母。然后在2019年,他将法国研究所的两个完整卷轴带到英国牛津附近的钻石光源(一个同步加速器X射线设备),以迄今为止最高的分辨率(每3D图像元素或体素4-8微米)扫描它们。

然而,解读完整的卷轴仍然是一项艰巨的任务,因此该团队向公众发布了所有扫描图像和代码,并启动了维苏威挑战赛。西尔斯说:“我们都同意,我们宁愿尽快解读里面的内容,也不愿试图囤积一切。”

大约1500个团队很快通过游戏玩家聊天平台Discord进行讨论和协作。奖项分阶段设计,并且每达到一个里程碑,获胜代码就会发布,供所有人在此基础上构建。法里托从小就对历史感兴趣,并且自学了拉丁语,他很早就参与其中。

与此同时,西尔斯的团队致力于虚拟展开,发布展平碎片的图像供参赛者分析。关键时刻出现在六月下旬,当时一位竞争者指出,在某些图像上,墨迹偶尔可以用肉眼看到,这是一种细微的纹理,很快就被称为“裂纹”。法里托立即专注于裂纹,寻找更多字母的线索。

八月的一个晚上,他在参加一个聚会时收到警报,说发布了一个新的片段,其中裂纹特别明显。他通过手机连接,在他的新图像上运行了他的算法。一个小时后走回家时,他拿出手机,在屏幕上看到了五个字母。“我当时又蹦又跳,”他说。“天哪,这真的要成功了。” 从那时起,仅用了几天时间就完善了模型,并识别出获得奖金所需的十个字母。

纸莎草学家们也很兴奋。“紫色”这个词尚未在打开的赫库兰尼姆卷轴中被解读出来。紫色染料在古罗马非常受欢迎,由海螺的腺体制成,因此该术语可能指紫色、长袍、能够负担得起染料的人的等级,甚至是指软体动物。但尼科拉迪说,比单个词更重要的是解读出任何东西。这项进展“为我们提供了恢复整个卷轴文本的潜在可能性”,包括标题和作者,以便可以识别和确定作品的年代。

看到不可见之物

伦敦谷歌DeepMind的员工研究科学家扬尼斯·阿塞尔将维苏威挑战赛描述为“独特而鼓舞人心”。但他指出,这是更广泛转变的一部分,人工智能 (AI) 正越来越多地帮助古代文本的研究。例如,去年,阿塞尔和索默斯基尔德发布了一个名为伊萨卡的AI工具,旨在帮助学者们收集未识别的古希腊铭文的日期和起源,并为填补任何空白的文本提供建议。它现在每周收到数百个查询,类似的努力也正在应用于从韩语到阿卡德语的各种语言,阿卡德语曾在古代美索不达米亚使用。

西尔斯希望机器学习能够开启他所谓的“隐形图书馆”。这指的是实际存在但无人能见的文本,包括中世纪书籍装订中使用的羊皮纸;重写本,其中后来的文字掩盖了下面的图层;以及纸莎草纸盒,其中旧纸莎草纸碎片被用来制作古埃及木乃伊盒和面具。

然而,目前,所有人的目光都集中在维苏威挑战赛上。大奖的截止日期是12月31日,西尔斯将气氛描述为“毫无保留的乐观”。法里托本人已经在他卷轴的其他片段上运行了他的模型,并且看到了更多字符出现。

本文经许可转载,并于2023年10月12日首次发表

© . All rights reserved.