骨干程序学习英语和日语元音

计算机模型以婴儿式的方式学习元音：即时学习

一份新的报告指出，一种新的计算机模型已经学会识别来自多位英语和日语使用者的元音类别，而无需“知道”它正在寻找的元音数量，也无需拥有要分析的完整声音列表。相反，它通过一次考虑一个元音，逐渐将元音归为不同的组，这让人想起婴儿可能如何注意声音。

该模型的设计者表示，这是改进语音识别软件以及更好地理解婴儿大脑如何识别其检测到的声音是在说一种语言而不是另一种语言的早期步骤。

斯坦福大学心理学教授、《美国国家科学院院刊》在线报告的合著者詹姆斯·麦克莱兰德说：“我们认为这项工作代表着一种趋势，即认为语言学习是一个依赖经验的过程。”

支持科学新闻报道

如果您喜欢这篇文章，请考虑通过以下方式支持我们屡获殊荣的新闻报道订阅。通过购买订阅，您正在帮助确保未来能够继续报道关于塑造我们当今世界的发现和想法的具有影响力的故事。

不列颠哥伦比亚大学（温哥华）的心理学家珍妮特·沃克在实验室中录制了母亲们用英语或日语对婴儿说无意义的声音 [点击此处获取声音样本]。这两种语言都有五个元音，粗略地说，它们有长短两种形式，例如英语中的“bait”和“bet”，它们的频率不同，而日语元音的区别在于声音的持续时间。

为了区分每种语言的“i”和“e”元音形式，麦克莱兰德、沃克及其同事将每个录制的元音转换为三个数字，分别代表声音的持续时间和两个主要频率。然后，他们一次一个元音地将这些值输入到他们的模型中。

该程序将每个值放在可能定义口语元音的许多持续时间或频率的连续统一体上。这些值加强了特定的持续时间或频率，逐渐为每种元音形式构建了一个三维空间。

该小组报告称，经过这样的训练，该程序在英语中正确分类了高达 93% 的元音，在日语中正确分类了 92% 的元音。

麦克莱兰德说，以前的语言学习模型不太现实，因为它们反复扫描大量声音数据，而不是一次扫描一个声音。

他补充说，采用类似的程序可能使语音识别软件能够适应同一种语言的不同使用者，从而提高其准确性。

他说，新的模型很难与婴儿学习进行比较，因为研究人员不知道婴儿听到什么声音。 “但是，”他补充说，“它在它所做的事情上非常成功，并且它使用了一套我们认为是在正确轨道上的原则。”