如何理解语言的深层结构

在乔姆斯基的“普遍语法”之外,科学家探索语言的基本设计约束

语言有两个显著特征,任何关于这种人类特有行为的科学理论都必须解释。首先,我们并非都说同一种语言。如果这不是如此普遍的现象,这会是一个令人震惊的观察。动物的交流系统往往是普遍的,任何该物种的动物都能够与任何其他动物交流。同样,许多其他基本的人类属性表现出较小的差异。如果没有基因或环境的意外,我们都有两只眼睛、一张嘴和四肢。 世界各地,我们悲伤时会哭泣,快乐时会微笑,有趣时会大笑,但我们用来描述这些的语言是不同的。

语言的第二个显著特征是,当您考虑可能的语言空间时,大多数语言都聚集在少数几个小的范围内。也就是说,大多数语言彼此之间的相似程度远远高于随机变异的预测。

约瑟夫·格林伯格的开创性工作 开始,学者们 已经编目了超过两千个 语言普遍性(所有语言都适用的事实)和偏见(大多数语言都适用的事实)。例如,在具有固定词序的语言中,主语几乎总是出现在宾语之前。如果动词描述了一个被引发的事件,那么引发该事件的实体就是主语(“约翰打破了花瓶”),而不是宾语(例如,“花瓶被打破 约翰”,意思是“约翰打破了花瓶”)。在像英语这样的动词与其中一个主语或宾语一致的语言中,它通常与主语一致(比较“孩子吃


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和思想的具有影响力的故事的未来。


s 胡萝卜”与“孩子们吃胡萝卜”),而不是与其宾语一致(这将看起来像“孩子吃s 胡萝卜” vs. “孩子吃胡萝卜s”),尽管在一些语言中,像匈牙利语,动词的结尾会发生变化以匹配 主语 和宾语。

当我向我的学生指出这一点时,我通常会得到茫然的注视。语言还能 如何运作?答案是:非常不同。科学家和工程师创造了数百种人工语言来完成数学(通常被称为“通用语言”)、逻辑和计算机编程的工作。这些语言没有上述任何特征,原因很简单:发明这些语言的研究人员从未费心去包括动词一致,甚至没有包括主语/宾语的区别。

自从我们意识到人类语言的变化有多么严格地受到限制以来,研究人员一直在努力寻找解释。也许最著名的解释是乔姆斯基的 普遍语法 假说,该假说认为人类天生就具有关于语言许多特征的内在知识(例如,语言区分主语和宾语),这不仅可以解释跨语言的普遍性,也许还可以解释语言学习是如何开始的。多年来,普遍语法由于多种原因变得越来越有争议,其中之一是理论的任意性:该理论只是用我们为什么拥有我们所拥有的语言,而不是其他语言的问题,取代了我们为什么拥有我们所拥有的普遍语法,而不是另一个语法的问题。

作为一种替代方法,许多研究人员探索了语言中一些普遍性源于必要的设计约束的可能性。基本思想是,一些可能但不存在的语言不存在,因为它们只是糟糕的语言。没有重复每个单词的语言。我们不需要普遍语法来解释这一点;纯粹的懒惰就足够了。同样,没有由单个高度模糊的词组成的语言(对不起 霍多);这样的语言几乎毫无用处。

在一篇激动人心的新近 论文 中,特德·吉布森及其同事为关于格标记和词序的著名偏见的设计约束解释提供了证据。格标记是附加在名词上的特殊词缀,用于指定名词是动词的主语还是宾语(等等)。在英语中,您可以在代词中看到这一点(比较 “她 谈话”),但除此之外,像大多数 SVO 语言(典型的词序是主语、动词、宾语的语言)一样,英语不标记格。相比之下,日语,像大多数 SOV 语言(典型的词序是主语、宾语、动词的语言)一样,标记格,其中 -wa 添加到主语,-o 添加到直接宾语。“Yasu 看到那只鸟”翻译为“Yasu-wa tori-o mita”,而“那只鸟看到了 Yasu”翻译为“Tori-wa Yasu-o mita”。问题是为什么在格标记和 SOV 词序之间存在这种关系。

吉布森及其同事提供了以下解释。要理解一个句子,你必须确定哪个角色正在做什么:是 Yasu 看到那只鸟,还是反过来?我们知道是主语在看,所以问题简化为识别主语。在 SOV 和 SVO 语言中,你(通常)可以使用词序来识别主语,但不同之处在于,在 SOV 语言中,主语和宾语彼此之间的距离要近得多,这使得你更容易混淆哪个实际上先出现(或者,说话者可能会意外地切换单词的顺序)。

吉布森及其同事的重点不是你为什么会感到困惑,但值得花点时间考虑一些可能性。最明显的一个(对我而言)涉及绑定问题。 绑定问题 用感知的例子最容易描述。在下面,您将看到一个红色的 R、一个绿色的 X 和一个蓝色的 I。但是,如果您直接查看右侧的加号,您不仅可能难以识别字母(它们应该看起来像线条和曲线的混乱),甚至难以弄清哪个字母是什么颜色(这将取决于您与屏幕的距离;您越靠近,问题就越严重;您可能需要盯着几秒钟才能获得完整的效果)。

那么,绑定问题就是确定我们感知体验的哪些方面都属于同一个对象。这个问题可能特别明显,因为这些不同的特征(颜色、形状等)最初由大脑的不同部分处理,并且必须在下游绑定在一起。如何完成这项工作是心理学尤其是神经科学中基本且未解决的问题之一。

语言处理面临着类似的挑战。我们有不同的信息流:说出了哪些单词以及说出了哪些顺序。在像英语这样的 SVO 语言中,将顺序信息绑定到正确的单词更容易,因为主语和宾语相距很远(中间有一个动词),就像上面例子中的拥挤问题通过拉开字母间距来缓解一样

SOV 语言没有这种技巧可用,这可能解释了为什么它们经常添加格标记作为主语和宾语的额外线索。

吉布森及其同事为这种解释提供了巧妙的证据。他们向人们展示了简单的场景,例如女孩踢球,并要求他们用手势描述场景(不允许说话)。大多数人先(用手势)描述女孩,然后是球,然后是踢的动作——也就是说,他们使用了 SOV 顺序。当然,当踢的事件涉及一个女孩和一个球时,谁踢了的问题并不多。

研究人员还要求人们用手势描述一个女孩踢一个男孩的事件。由于男孩和女孩都能够踢球,因此很有可能对谁踢了谁感到困惑。现在,参与者更有可能(用手势)描述女孩,然后是踢的事件,然后是男孩——也就是说,他们切换到 SVO 顺序。无论参与者是英语(SVO 语言)的母语人士还是韩语或日语(SOV 语言)的母语人士,情况都是如此(有一些复杂情况,您可以在论文中阅读)。

吉布森及其同事为当格标记不可用时,你为什么可能想使用 SVO 词序而不是 SOV 词序提供了一个很好的解释,他们还表明,人们在不受干扰的情况下,实际上会这样做。

还有很多工作要做。你可能会想知道为什么 SOV 语言会存在,特别是考虑到它们通常会让你学习所有那些烦人的词尾。吉布森及其同事认为,我们可能对 SOV 顺序有默认的偏见,这体现在以下事实中:(a) SOV 语言(如日语)实际上比 SVO 语言(如英语)更常见,并且 (b) 他们研究中的参与者总体上略微偏爱 SOV 顺序。研究人员还引用了证据,表明新创建的语言可能更倾向于 SOV。不过,这些都不能解释 为什么 SOV 会是默认的;像往常一样,一个新问题与旧问题的答案搭上了顺风车。我们还需要解释为什么有些 SVO 语言有格标记,而有些 SOV 语言没有(作者勾勒出了一些可能性)。

总的来说,这篇论文提供了迄今为止最清晰的例子之一,说明人类语言的一个重要趋势——你不会期望通过纯粹的随机机会存在的偏见——可以通过参考计算和信息论的普遍原则来解释。这并不一定排除普遍语法——也许普遍语法巧妙地实现了良好的计算原则——但它确实阐明了为什么人类语言,并由此引申出人性的本质,会是这样而不是其他方式。

您是专门研究神经科学、认知科学或心理学的科学家吗?您是否阅读过一篇您想撰写的最新同行评审论文?请将建议发送给 Mind Matters 编辑 加雷斯·库克,他是普利策奖获奖记者,也是 NewYorker.com 的定期撰稿人。加雷斯也是 《美国最佳信息图表》的系列编辑,您可以通过 garethideas AT gmail.com 或 Twitter @garethideas 与他联系。

Joshua K. Hartshorne is a Ruth L. Kirschstein NRSA post-doctoral fellow in the Computational Cognitive Science group at MIT and an occasional contributor to 大众科学 Mind. He conducts research both in his brick-and-mortar laboratory and online at GamesWithWords.org. You can follow him on Twitter at @jkhartshorne.

More by Joshua K. Hartshorne
© . All rights reserved.