软件复活逝去的语言

一项新的研究表明,计算机算法在重建已灭绝的“原始语言”的发音方面,几乎与训练有素的语言学家一样出色。

加入我们的科学爱好者社区!

一项新的研究表明,计算机算法在重建已灭绝的“原始语言”的发音方面,几乎与训练有素的语言学家一样出色。

不列颠哥伦比亚大学统计学系助理教授、描述该算法的论文的主要作者亚历克斯·布沙尔-科特说:“我们的[计算机]系统目前正在做一项基本的工作。” 但这位统计学家补充说,该程序的工作效果足够好,它可能能够让语言学家有一个良好的开端。

几个世纪以来,学者们一直在手工重建语言:查看两种或多种语言中的同一个词,并对该词的“祖先”的发音做出有根据的猜测。例如,西班牙语中“男人”(“hombre”)一词和法语中“男人”(“homme”)一词都源于拉丁语“homo”。语言学家比较后代语言中的词来重建母语的方式,恰如其分地称为比较法。


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将有助于确保关于塑造我们当今世界的发现和想法的具有影响力的故事的未来。


[计算机程序识别中世纪的迷因]

19世纪早期的语言学家弗朗茨·博普是第一个使用这种方法比较希腊语、拉丁语和梵语的人。格林兄弟的雅各布·格林使用了比较法来展示日耳曼语系如何从一个共同的祖先发展而来。

这位统计学家说,他和布沙尔-科特的程序的区别在于,“我们是在更大规模上做的。”

作为概念验证,布沙尔-科特将来自 637 种南岛语系(在印度尼西亚、马达加斯加、菲律宾、巴布亚新几内亚、马来西亚等地使用)的词语输入到新的算法中,该系统得出了一份所有这些语言的祖先词语的发音列表。在超过 85% 的情况下,自动重建结果与语言学家普遍接受为正确的祖先词语仅相差一个字符。

该算法不会取代训练有素的人类语言学家,但可以加快语言分析的速度。

布沙尔-科特说,使用计算机进行大规模重建还具有另一个优势:有了大数据集,“你可以真正开始发现规律……你可能会发现某些声音比其他声音更容易发生变化。”

因此,布沙尔-科特的团队测试了“功能负载假说”,该假说认为,对于区分两个词更重要的声音,随着时间的推移不太可能发生变化。 1967 年对该假设进行的正式测试研究了四种语言;布沙尔-科特的算法研究了 637 种。

布沙尔-科特和他的合著者在新研究中写道:“如果我们无法重建大量的原始语言,那么揭示的模式将不明显。”

除了帮助语言学家了解过去人们的说话方式外,研究古代语言也许可以回答历史问题。

例如,布沙尔-科特说,“假设人们有兴趣找出欧洲是什么时候被定居的。如果你能弄清楚定居人口的语言是否有一个表示轮子的词,那么你就可以了解事物发生的顺序,因为你会有一些记录显示轮子是什么时候发明的。”

版权所有 2013 TechNewsDaily,TechMediaNetwork 公司。保留所有权利。未经许可,不得发布、广播、改写或重新分发此材料。

© . All rights reserved.