两项发表在《自然》杂志上的新研究表明,日常语言中使用频率最高的词汇演变速度最慢。
在一篇论文中,哈佛大学的研究人员专注于英语动词变位在1200年期间的演变。在另一项研究中,英国雷丁大学的一个团队回顾了同源词(不同语言中用于同一物体或含义的发音相似的词,例如“water”和德语“wasser”),以确定所有印欧语系语言如何从6000至10000年前存在的共同祖先发展而来。
雷丁大学的进化生物学教授马克·佩吉尔在谈到他的研究时说:“我们的频率效应使我们能够识别……超保守的语言元素。也就是说,它们是我们一直使用的词。”
关于支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保未来能够继续产出关于塑造我们当今世界的发现和思想的具有影响力的报道。
在寻找同源词的过程中,佩吉尔和他的团队检查了87种印欧语系语言中的约200个词,包括“water”、“two”、“to die”和“where”等词。每个词的同源词的独特类别数量从一个(表示所有词听起来都相似)用于常用概念(如数字)到多达46种不同的基本声音来描述单个实体(如鸟)。例如,在所有印欧语系语言中,数字三的词都与英语版本相似:从西班牙语的tres到德语的drei再到印地语的theen。相比之下,鸟的词有几种不同的声音与之相关,例如西班牙语的pajaro和法语的oiseau。
然后,研究人员将重点缩小到仅四种印欧语系语言(英语、西班牙语、希腊语和俄语)中每个词的使用频率。佩吉尔说,该团队发现,即使含义相同的词不是同源词,它们的使用频率在总体上也是相似的。他说:“西班牙语中的高频词与英语中的高频词相同。这[表明]我们可以提出一种印欧语系的使用频率。”
通过结合他们的数据,研究人员确定,替换不常用的词最少需要750年,而新词演变成最常用词则需要长达10000年。
哈佛大学的研究人员专门研究了英语的词根,追溯了该语言中动词变位从1200年前的《贝奥武夫》时代到16世纪的莎士比亚时代再到现在的形式的演变过程。多年来,英语中几种动词的过去式形式已经消失,现在只剩下一个规则:在动词末尾添加“-ed”。(过去式形式以“-ed”结尾的动词在现代英语中是“规则动词”。)
研究人员查阅了可以追溯到古英语时代的语法文本,编目了他们遇到的所有不规则动词。其中包括:仍然不规则的“sing”/“sang”、“go”/“went”,以及已经规则化的“smite”,它在古英语中曾经是“smote”,但后来变成了“smited”,还有“slink”,现在是“slinked”,但在1200年前是“slunk”。他们找到了177个在古英语中不规则的动词和145个在中英语中仍然不规则的动词;今天,177个动词中只有98个没有被“规则化”。
在计算了177个不规则古英语动词中每个词的使用频率后,研究人员确定,演变成规则变位形式最快的词的使用频率明显低于那些随时间推移保持不变的词。事实上,他们的统计分析确定,给定两个动词,如果一个动词的使用频率比另一个动词低100倍,那么它的演变速度将比使用频率更高的动词快10倍。他们预测,下一个趋于规则化的动词将是wed,它的过去式将从wed规则化为wedded。
哈佛大学应用数学专业的研究生、研究报告的共同作者埃雷兹·利伯曼说:“通过提高频率,动词变得更加稳定。”他补充说,哈佛大学和雷丁大学的论文都为自然选择的一个版本提出了论据,该版本作用于语言进化并反映了生物进化。他说:“这两项研究都说明了频率对词语生存的深刻影响。”
《语言学习和进化的计算本质》一书的作者、芝加哥大学计算机科学和统计学教授帕尔塔·尼约吉说,这些实证研究结果与关于词汇进化的理论模型是一致的。他指出:“语言在不断变化。在生物进化中,这个事实已经受到了很多关注,但事实是,在语言中,这种情况也一直都在发生。达尔文在《物种起源》中评论说,语言会随着时间推移而进化,这就像物种形成一样。”