学者们长期以来一直在思考语言与思想之间的联系,以及两者在何种程度上相互交织——通过询问语言是否在某种程度上是思考的必要先决条件。
英国哲学家和数学家伯特兰·罗素断然肯定地回答了这个问题,他断言语言的根本目的是“使没有语言就无法存在的思想成为可能”。但即使是对自然界进行粗略的观察,也能说明为什么罗素可能是错的:动物无需语言即可完成各种解决问题的挑战,这些挑战证明了高水平的认知能力。黑猩猩可以在策略游戏中胜过人类,而新喀里多尼亚乌鸦则会制造自己的工具,使其能够捕获猎物。
尽管如此,人类执行认知任务的水平之高是黑猩猩所无法比拟的——我们可以解微分方程或创作雄伟的交响曲。对于这些物种特有的成就,是否需要某种形式的语言?我们需要文字或句法作为支架来构建我们思考的事物吗?还是大脑的认知区域设计出完全成熟的思想,然后我们使用文字作为交流媒介来传达这些思想?
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
伊芙琳娜·费多连科是一位神经科学家,她在麻省理工学院麦戈文脑研究所研究语言,多年来一直试图回答这些问题。她记得在 2000 年代初,当她还是哈佛大学本科生时,语言产生思想的假设在学术界仍然非常突出。她自己也成为了信奉者。
15 年前,当新的脑成像技术变得广泛可用时,费多连科开始了她的研究,她想用必要的严谨性来评估这个想法。她最近与人合著了一篇发表在《自然》杂志上的观点文章,其中包括一篇关于她多年来研究成果的总结。文章清楚地表明,在费多连科看来,陪审团不再悬而未决:语言和思想实际上是不同的实体,大脑会分别处理它们。最高水平的认知——从新颖的问题解决到社会推理——可以在没有文字或语言结构的帮助下进行。
语言的作用有点像心灵感应,它使我们能够将自己的想法传达给他人,并将对我们这个超社会物种的繁荣至关重要的知识和技能传递给下一代。但与此同时,患有失语症的人,有时甚至无法说出一个字,仍然可以从事一系列对思想至关重要的认知任务。《大众科学》与费多连科讨论了语言与思想的分歧,以及大型语言模型等人工智能工具在继续探索思考与说话之间互动的前景。
[以下是采访的编辑稿。]
您是如何决定提出语言和思想是否是独立实体这个问题的?
老实说,我有一种非常强烈的直觉,认为语言对于复杂的思想至关重要。在 2000 年代初期,我真的被这样的假设所吸引:也许人类拥有一些特殊的机制,特别适合计算分层结构。而语言是基于分层结构的系统的主要例子:单词组合成短语,短语组合成句子。
许多复杂的思想都基于分层结构。所以我认为,“好吧,我要去寻找处理语言分层结构的大脑区域。”当时有一些说法认为左额叶皮层的某些部分就是这种结构。
但是,人们当时用来检查大脑中语言和其他领域之间重叠的方法并不是那么好。所以我认为我会做得更好。然后,就像科学中经常发生的那样,事情并没有像你想象的那样发展。我搜索了这种大脑区域存在的证据——但它不存在。
你发现大脑中计算语言分层结构的区域和帮助你在数学或音乐中做同样事情的大脑区域之间存在非常明显的区分。许多科学研究都始于一些假设,这些假设通常基于直觉或先前的信念。
我最初的训练是[语言学家诺姆·乔姆斯基的传统],其中的教条一直是我们将语言用于思考:思考是语言在我们物种中进化的原因。因此,这是我从那次训练中获得的期望。但是,当你做科学研究时,你就会明白,大多数时候你是错的——这很棒,因为我们了解了事物在现实中是如何运作的。
您发现了哪些证据表明思想和语言是独立的系统?
证据来自两种不同的方法。一种基本上是科学家们几个世纪以来一直在使用的一种非常古老的方法:观察不同能力方面的缺陷——例如,脑损伤患者的能力缺陷。
使用这种方法,我们可以观察到语言障碍患者——某种形式的失语症。失语症作为一个病症已经被研究了几个世纪。对于语言与思想系统如何相关的问题,最有用的案例是真正严重的损伤案例,即所谓的完全性失语症,患者由于大脑左半球的大面积损伤而基本上完全丧失了理解和产生语言的能力。你可以询问这些患有严重语言障碍的人是否可以完成需要思考的任务。你可以让他们解决一些数学问题或进行社会推理测试,当然,所有的指令都必须是非语言的,因为他们再也无法理解语言信息了。科学家们在与没有语言的人群——研究学语前婴儿或研究非人类动物物种——合作方面有很多经验。因此,绝对有可能以非语言的方式传达指令。而这项工作的主要发现是,有些人患有严重的语言障碍,但在我们迄今为止测试过的所有认知任务中,他们似乎都完全正常。
现在已经有人对许多、许多不同类型的任务进行了测试,包括可能被称为思考的任务,例如解决数学问题或逻辑谜题,或推理别人相信什么,或推理物理世界。因此,这是一大块来自这些失语症人群的证据。
另一种方法是什么?
一种很好的互补方法,始于 1980 年代和 1990 年代,是一种脑成像方法。我们可以测量人们从事不同任务时血流量的变化,并询问两个系统是截然不同的还是重叠的——例如,你的语言区域是否与帮助你解决数学问题的区域重叠。这些脑成像工具非常适合解决这些问题。但在我能够提出这些问题之前,我需要一种方法来稳健可靠地识别个体大脑中的语言区域,因此我职业生涯的最初几年都在开发工具来做到这一点。
一旦我们找到了一种找到这些语言区域的方法,并且我们知道这些区域是在成年期受损时导致失语症等疾病的区域,我们就可以询问当人们从事各种思考任务时,这些语言区域是否活跃。因此,你可以来到实验室,我可以把你放入扫描仪中,通过让你执行一个只需几分钟的简短任务来找到你的语言区域——然后我可以让你做一些逻辑谜题或数独,或一些复杂的工作记忆任务或计划和决策。然后我可以询问,当我们知道处理语言的区域在你从事这些其他类型的任务时是否在工作。我们现在已经做了数十项研究,研究各种非语言输入和任务,包括许多思考任务。我们一次又一次地发现,当人们从事这些思考活动时,语言区域基本上是静默的。
那么,如果不是为了思考,语言的作用是什么?
我现在正在做的事情是分享我所拥有的一些知识,而你可能只拥有部分版本——一旦我通过语言将其传递给你,你就可以更新你的知识,并将这些知识也记在脑海中。所以这基本上就像心灵感应的捷径。我们无法读取彼此的想法。但是我们可以使用这种称为语言的工具,这是一种灵活的方式来交流我们的内心状态,从而将信息传递给彼此。
事实上,你可能学到的关于世界的大部分事物,都是通过语言而不是通过直接与世界的经验来学习的。因此,语言非常有用。你可以很容易地想象它如何赋予进化优势:通过促进合作活动、传播关于如何制造工具的知识以及传递社会知识。随着人们开始在更大的群体中生活,跟踪各种社会关系变得更加重要。例如,我可以告诉你,“哦,我不信任那个人。”此外,将知识传递给后代非常困难,而语言使我们能够非常有效地做到这一点。
与我们拥有语言是为了交流的观点一致,过去几十年积累的证据表明,人类语言拥有的各种属性——世界上大约有 7,000 种口语和手语——都经过优化,可以高效地传递信息,使事物易于感知、易于理解、易于产生并且易于儿童学习。
语言是使人类与众不同的原因吗?
我们从大脑进化中了解到,皮质片(大脑的外层)的许多部分在人类中得到了极大的扩展。大脑的这些部分包含几个不同的功能系统。语言是其中之一。但还有一个系统使我们能够推理其他人的想法。还有一个系统支持新颖的问题解决。还有一个系统使我们能够整合跨越更长时间范围的信息——例如,将几个事件串联在一起。最有可能的是,使我们成为人类的不是一个“金票”,正如有些人所说的那样。这不是一件事情发生的;更有可能的是,一大堆系统变得更加复杂,占据了更大的皮质区域,并允许更复杂的思想和行为。
语言和思考系统是否相互作用?
神经科学中没有很好的工具来研究语言和思想之间的系统间相互作用。但是,随着人工智能的进步,正在出现有趣的新机会,我们现在拥有一个模型系统来研究语言,即 GPT-2 及其后继者等大型语言模型。这些模型在语言方面做得非常好,可以生成完全符合语法且有意义的句子。它们不太擅长思考,这与语言系统本身并不能让你思考的想法非常吻合。
但是我们和许多其他小组正在进行一项工作,其中我们将某种版本的人工神经网络语言模型作为人类语言系统的模型。然后,我们尝试将其连接到一些更像我们认为的人类思想系统的系统——例如,数学应用程序等符号问题解决系统。借助这些人工智能工具,我们至少可以问:“思想系统、推理系统可以与存储和使用语言表示的系统以哪些方式交互?”这些所谓的神经符号方法为开始解决这些问题提供了令人兴奋的机会。
那么,大型语言模型如何帮助我们理解语言运作方式的神经科学?
它们基本上是研究语言神经科学的研究人员的第一个模式生物。它们不是生物有机体,但在这些模型出现之前,除了人脑之外,我们没有任何其他可以进行语言处理的东西。因此,正在发生的事情令人难以置信地兴奋。你可以在模型上做你在你试图理解的实际生物系统上无法做的事情。我们现在可以提出许多、许多以前完全遥不可及的问题:例如,关于发展的问题。
当然,在人类中,你无法操纵儿童获得的语言输入。你不能剥夺孩子的语言,或以某种方式限制他们的输入,并观察他们如何发展。但是你可以构建这些模型,这些模型仅在特定类型的语言输入上进行训练,或者在语音输入而不是文本输入上进行训练。然后你可以看看以特定方式训练的模型是否更好地概括了我们在人类中看到的关于他们的语言行为或对语言的大脑反应。
因此,正如神经科学家长期以来使用小鼠或猕猴作为模式生物一样,我们现在可以使用这些计算机模型,它们不是生物的,但在它们自己的方式上非常强大,来尝试理解语言如何发展或被处理或在衰老中衰退的某些方面,等等。
我们对这些模型的内部结构有更多的访问权限。与我们可以对这些模型做的事情相比,我们用来干扰大脑的方法,至少是对人脑的方法,要有限得多。