2013年8月6日

真见鬼！学习语言的数学

“十八个名词和三个动词，它们现在都在她的手指里了。我只需要时间将其中一个推入她的脑海。一个，然后太阳下的一切都会随之而来。” ——安妮·沙利文，《奇迹创造者》一百多年前，一个女婴生病了，可能是猩红热（或脑膜炎），[...]

本文发表于《大众科学》的前博客网络，反映了作者的观点，不一定反映《大众科学》的观点

“十八个名词和三个动词，它们现在都在她的手指里了。我只需要时间将其中一个推入她的脑海。一个，然后太阳下的一切都会随之而来。” -- 安妮·沙利文，《奇迹创造者》

一百多年前，一个女婴生病了，可能是猩红热（或脑膜炎），导致她失聪和失明——并且在很大程度上失语，因为她在 19 个月大的时候患了这种疾病，尽管到她八岁时，海伦·凯勒已经 разработала 一套 60 多个手语系统，以帮助她向家人表达基本需求。但她对语言的理解非常少，正如家庭教师安妮·沙利文在 1887 年 3 月加入凯勒家时发现的那样。沙利文试图纠正这一点，此外还教导这个孩子基本的礼仪并处理她经常发生的暴力发脾气。

沙利文的方法包括将各种物体的单词拼写到海伦的手中：例如，当她在第一次见面时递给孩子一个娃娃时，拼写“d-o-l-l”。但海伦不明白字母组成一个单词，而这个单词描述了一个真实世界的物体——即，世界上的一切都有一个名字。

支持科学新闻报道

如果您喜欢这篇文章，请考虑通过以下方式支持我们屡获殊荣的新闻报道订阅。通过购买订阅，您正在帮助确保有关塑造我们今天世界的发现和想法的具有影响力的故事的未来。

过了几个月，但在命运攸关的一天，当海伦在餐桌上行为不端并跑到院子里时，沙利文跟着她来到水泵旁。当水流过海伦的手时，沙利文在另一只手的掌心中拼写出“w-a-t-e-r”——年轻女孩的脑海中闪过一丝灵光。她建立了联系，急切地四处奔走，指着各种物体，以便沙利文可以在她的手掌中拼写出相应的单词。这改变了她的一生。海伦·凯勒后来成为一名完全识字的人，一位出版作家，以及聋人和盲人的坚定倡导者。

那个转折点——语言的本质——在《奇迹创造者》中得到了令人难忘的描绘，该剧于 1959 年首次在百老汇制作，后来在 1962 年被拍成电影，由帕蒂·杜克饰演沙利文（

她因扮演海伦·凯勒的角色而获得奥斯卡奖。安妮·班克罗夫特饰演安妮·沙利文。两人都因其角色获得了奥斯卡奖。）

当我浏览德国和苏格兰物理学家在《物理评论快报》上发表的一篇最新论文时，我想到了凯勒的故事，该论文展示了关于语言习得的新模拟，表明通过假设不存在同义词，可以更快地掌握一门新语言的词汇。是的，我们学习新单词的方式中存在数学和物理成分，这是一个活跃的研究领域。

学习新单词涉及两种基本机制。首先是启发式方法，孩子能够通过依赖外部线索来推断单词的含义，例如跟随说话者的目光——或者让说话者指出单词描述的物体，就像沙利文对凯勒所做的那样。但是，即使有这些线索，一个给定的单词也可能有不止一种可能的含义，这是一种残留的不确定性。

这就是第二种机制，横向情境学习发挥作用的地方。通常，这种不确定性可以通过比较在不同语境中使用给定单词的许多不同实例来减少。如果有一个含义在几个这样的实例中似乎仍然是合理的，那么这会增加这是正确含义的可能性。换句话说，当单词和含义反复共同出现时，你会加强它们之间的关联。这就是为什么这对学习的神经网络模型来说是一个如此有用的工具，例如，尽管这篇特定论文的作者（理查德·布莱斯、雷纳·雷泽瑙尔和肯尼·史密斯）指出，这也是一个从嘈杂数据中重建关联的有用纠错过程。

儿童平均每天学习大约十个单词，到 18 岁时，他们的个人词汇量超过 60,000 个单词，并且他们采用许多不同的策略来做到这一点——包括在含义不明确时使用横向情境学习。

例如：如果一个孩子听到“杯子”这个词，而孩子面前只有一个杯子，那么意思很清楚，就像海伦·凯勒清楚地知道“水”与从水泵中涌出并流过她手的凉爽液体相关联一样。但是，如果既有杯子又有球呢？孩子怎么知道哪个是正确的含义呢？

她可能会记得在不同的时间听到“杯子”这个词，当时杯子与另一个物体（如娃娃）一起出现。在这两个实例中，唯一的共同物体是杯子，因此“杯子”一定与该物体有关。这就是横向情境学习。将此与不存在同义词的假设（即，相互排斥）结合起来，甚至可以消除更多的不确定性。含义变得非常清楚。

“这是一种自举技术，您可以使用之前学习[单词]的信息来消除某些含义，”合著者布莱斯（爱丁堡大学）告诉物理焦点。他和他的同事希望评估相互排斥策略与其他确定含义的方法相比，在处理数百个单词时有多有效。

为了找出答案，他们转向非平衡统计物理学，该物理学通常用于模拟分子相互作用。在这里，一个单词变得类似于一个分子，该模型显示了给定状态（该单词的可能含义）的概率分布如何随时间演变。“杯子”与房间里的杯子相关的概率最初很低，因为存在许多混淆变量，但随着时间的推移，系统达到平衡——这些混淆因素逐渐被排除，最终单词被附加到一个单一的含义。

布莱斯等人。本质上构建了一个计算机模型，假设一种语言包含 50 或 100 个单词，每个单词都与典型的使用频率相关联。然后，他们模拟了一个“学习者”，向其展示一个单词和一系列“物体”——同样是模拟的——其中至少一个代表正确的含义，尽管有时可以应用多个含义（即，同义词的等价物）。“学习者”将比较许多这样的事件——横向情境学习在起作用。研究人员还能够跟踪“学习者”获得多达 60,000 个单词的完整词汇需要多长时间。

然后，他们比较了两种在不同条件下进行的单独案例。第一种情况不采用相互排斥——即，不排除同义词——因此，一旦一个单词被“学习”，它就不会自动从所有可能的混淆因素列表中删除。结果：仅使用这种策略，我们将花费一生的时间来获得基本的 60,000 个单词的词汇量。但是，当他们在第二种情况下运行模拟时，其中不允许同义词，学习新单词的时间显着减少。作者总结说，显然，相互排斥是语言习得方面非常有效的策略，而统计物理学“可以为理解儿童如何学习单词的含义做出很大贡献”。

这真的很巧妙，虽然重要的是要记住，这只是对一个极其复杂的认知过程的某个方面的有针对性、精心设计的模拟，该过程涉及的不仅仅是非平衡统计物理学。但印第安纳大学认知科学家琳达·史密斯确实告诉物理焦点，相互排斥非常关键：“竞争是大脑运作的方式——在所有领域，在所有层面上。” 所以就是这样。

参考文献:

布鲁姆，P. 儿童如何学习词义。马萨诸塞州剑桥市：麻省理工学院出版社，2000 年。

布莱斯，理查德；雷泽瑙尔，雷纳；史密斯，肯尼。(2013) “不确定和非均匀世界中词汇学习的随机动力学”，《物理评论快报》 110: 258701。

马克曼，E.M. 和瓦赫特尔，G.F. (1988) “儿童使用相互排斥来约束词义”，《认知心理学》 20: 121。

麦地那，T.N. 等人。(2011) “单词如何以及不能通过观察来学习”，《美国国家科学院院刊》 108: 9014。

迈尔，理查德 (1991)。“聋童的语言习得”，《美国科学家》 79 (1): 60–70。