无人监督时的学习

我们大部分知识的获取都无需任何指导。现在,科学正在揭示我们的大脑如何完成这个日常奇迹

斯图尔特·布赖尔斯

想象一下,你第一次访问一个外国城市——比如伊斯坦布尔。你找到了地铁站,茫然地站在售票机前。在弄清楚如何支付车费后,你穿过嘈杂的人群,寻找将你带到酒店的火车。你小心翼翼地、断断续续地移动,方向多次改变。然而,在地铁通勤几天后,你就能轻松地穿梭于这个系统。仅仅通过体验新环境,你就迅速掌握了它的复杂性。这种学习是如何实现的?事实是,神经科学家也不知道。

我们今天所知的学习理论仍然主要基于伊万·巴甫洛夫和他听到铃声就流口水的狗的百年实验。他的理论已经产生了大量关于我们如何通过刺激和奖励(或惩罚)的配对以及共同放电的神经元之间连接的加强来获得行为的知识。这是我们对宠物以及在某种程度上对孩子进行的训练,但它很少能解释大多数人类的学习。事实上,无论是认识陌生人、适应新环境还是学习俚语,我们的大脑都在日常生活中不断地、毫不费力地吸收大量信息,而无需零食、赞扬或电击来激励我们。

直到最近,如果你问像我这样的神经科学家这个过程是如何运作的,我们还会耸耸肩。但一些研究人员已经开始创新地使用技术,包括虚拟现实,来探索人类大脑在复杂、真实世界环境中的运作方式——这个过程被称为无监督学习。正如我通过访问几个先锋实验室所了解到的,他们发现这种类型的认知不仅仅是建立连接局部神经元的通路。相反,无监督学习调动了大脑的广泛区域,并涉及到神经回路处理信息的整体变化。此外,通过研究我们学习时大脑电波的 shifting 电模式,研究人员可以可靠地猜测我们在想什么(是的,初步的读心术是可能的!),并且他们可以预测我们在学习某些学科方面的天赋。当这些科学家面对无监督学习的复杂性时,他们发现自己正在努力解决人类存在的最深奥的谜团之一:大脑如何创造思维。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和思想的具有影响力的故事的未来。


登上虚拟舰船

这个巨大房间的墙壁和天花板都被漆成黑色。布置在空间周围的二十四个数字摄像头探测我身上的红外二极管,以跟踪我的运动,并将它们输入到计算机中,当我四处走动时。我位于加州大学圣地亚哥分校超级计算机中心的虚拟现实房间内——这可能是地球上最接近《星际迷航》企业号星舰上的全息甲板的地方。神经科学家霍华德·波伊兹纳使用这个设施来研究无监督学习——在这种情况下,我们如何学习掌握一个陌生的环境。

二极管不是我佩戴的唯一小玩意。我的头上戴着一个橡胶帽,上面镶嵌着 70 个电极,这些电极将我的大脑产生的电信号发送到我背着的专用背包内的仪器中。我还戴着配备 12 个微型视频投影仪和高分辨率屏幕的大型护目镜。

在我来这里的前一天,我参观了停泊在圣地亚哥港的美国海军航空母舰“中途岛”号。我万万没想到这会是一个多么巧合:波伊兹纳和他的同事们以航母的布局为模型,构建了他们的虚拟现实序列。当他们打开我护目镜内的投影仪时,我立刻被传送回了那艘船上。我看到的是航空母舰内部储藏室的 120 度全景,令人信服。抬头看,我看到三角形的钢桁架加固了支撑飞行甲板的天花板。低头看,我看到难看的蓝色政府配发油毡。实验室周围的高保真扬声器创造了一个三维声音空间,以完成这种错觉。

使用脑电图 (EEG) 记录人们探索虚拟现实世界的研究表明,大脑是如何学习一个陌生地方的。在加州大学圣地亚哥分校的 VR 实验室中,作者()在一个计算机生成的储藏室中弹出一个装有隐藏物体的绿色球体,很像化身正在探索的场景()。在控制台上,神经科学家约瑟夫·斯奈德()监控着作者在房间里走动时看到的东西。图片由霍华德·波伊兹纳加州大学圣地亚哥分校和 R. 道格拉斯·菲尔兹()提供;摘自约瑟夫·斯奈德等人发表在神经科学杂志第 33 卷第 38 期中的“人类皮层Θ在自由探索期间编码空间并预测后续记忆”;2013 年 9 月 18 日(

波伊兹纳解释说,逼真是至关重要的,既是为了沉浸感,也是为了帮助大脑组织可用的丰富感官信息。“如果你只是移动操纵杆或按下按钮,你就不会激活构建空间地图的大脑回路,”他说。“在这里,你正在环境中行走。你正在学习如何在其中移动,如何与之互动。你的大脑总是在预测。”

我可以在虚拟环境中行走,同时我的脑电波被记录下来,这本身就是一个突破。通常,人们在进行脑电图 (EEG) 记录时必须保持静止,以消除肌肉收缩时产生的电信号,否则这些信号会掩盖微弱的脑电波。波伊兹纳的小组设计了硬件和软件来消除这种噪声,让受试者可以自由活动。“我们正在把你放进电子游戏中,”波伊兹纳说。

我走到一个椭圆形舱口,向外窥视停放着成排战斗机的机库甲板。我抬起腿,准备跨过通往甲板的高门槛。“不要出去那里,”波伊兹纳说。“你必须待在储藏室里。”我迅速缩回了腿。从他的角度来看,我一定像是在空房间里做哑剧。

我看到房间里的储物架上放着灰色气泡,大小和沙滩球差不多。“你正在寻找一个绿色气泡,”波伊兹纳说。我在房间里搜索。向左转,我看到它和旁边的其他灰色球体一起放在架子上。我伸出手,触摸绿色气泡。它破裂了!一个隐藏在里面的物体出现了——一个红色灭火器。我转身,在房间的另一个角落找到并探测到另一个绿色气泡。我戳破它,看到里面装着一把扳手。

当我探索这个新环境时,波伊兹纳可以从我的脑电波活动的变化中看出,我正在形成储藏室空间的心理地图。神经元通过产生短暂的电脉冲进行交流,这些脉冲大约为十分之一伏特,持续时间为千分之一秒——这种信号非常微弱,以至于要检测单个神经元的放电,你必须打开颅骨,并将微电极直接接触神经细胞。尽管如此,当大群神经元一起放电时,它们周围组织电场的随之而来的波动足够强,以至于头皮上的电极可以检测到它们。这些脑电图记录很像人群的喧嚣,在体育场停车场可以听到,而单个观众的谈话则听不到。

用脑电波构建地图

大脑的电活动以不同频率的波的形式扫过大脑。一些脑电波像高频风暴一样冲击,而另一些则像海浪一样以缓慢的振荡滚动。脑电波随着不同的认知功能而发生显著变化[参见侧边栏中的框]。波伊兹纳的实验发现,当受试者在房间内移动并构建空间地图时,低频 θ 波(振荡频率约为 3 至 8 赫兹)在顶叶中增加。(顶叶位于大脑的后上方,大致位于头顶被颅骨覆盖的部分下方。)

科学家们不确定为什么 θ 频率的脑电波功率在空间学习期间会发生变化。但他们确实知道 θ 波在加强突触方面很重要,因为我们形成了记忆。事实上,在我自己关于记忆细胞机制的研究中,我以 θ 频率刺激神经元,以加强我在培养皿中保持活性的鼠脑切片中的突触。约瑟夫·斯奈德,这位在我探索虚拟“中途岛”号时操作电脑的研究科学家,认为由于 θ 波的低频率,它可能负责大脑网络内的长程通信,就像低频 AM 无线电信号比高频 FM 广播传播得更远一样。

在该模型中,脑电波在学习中的作用是将大群神经元组合成功能组件,以便它们可以一起放电,并随着电波穿过大脑而乘着电波的波峰和波谷——这正是形成我们环境的空间地图或编码任何复杂记忆所必须发生的。考虑一下所有必须汇聚在一起才能给我们生动记忆的感官元素、认知过程和情感感觉:球体的绿色、破裂的意外惊喜和声音、储藏室中的位置、对隐藏在里面的灭火器的识别。该体验的每个方面都编码在专门用于声音、颜色和其他感觉的大脑不同部分的回路中。然而,为了学习和记住这个阵列作为一个连贯的体验,所有这些元素都必须结合在一起。从波伊兹纳对人们在遇到虚拟现实环境时的脑电波的窃听中,我们现在知道 θ 波对于这种合成和学习至关重要。

除了在空间地图形成中的作用外,脑电波还是特定刺激后认知功能的关键。这种诱发反应就像石头投进池塘后产生的涟漪,与水中随机的、始终存在的运动形成对比。波伊兹纳分析了我在戳破绿色气泡并发现隐藏在里面的物体那一刻的脑电波反应。他发现,在我戳破绿色气泡后 160 毫秒,我的诱发脑电波中出现了一个特征性的涟漪。“这非常快,”波伊兹纳观察到。“仅仅做一个眼球运动就需要 200 毫秒。这是大脑正在检测到一些不对劲的前意识感知。”

图片来源:斯图尔特·布赖尔斯

当波伊兹纳将 VR 研究中的受试者带回第二天时,他发现他们在没有任何指导、预警或努力的情况下,显然已经详细记住了储藏室。诱发的脑电波以一种令人惊讶的方式揭示了这一事实。波伊兹纳和他的同事们故意错放了一些隐藏在绿色气泡中的物体。因此,当一个人戳破一个前一天装有灭火器的绿色气泡,但现在里面装的是扳手时,诱发的脑电波反应比受试者在与之前相同的位置找到物体时要大得多。

比眨眼还快,我们的大脑就知道我们的环境发生了变化,而且我们的大脑在我们的大脑理解它之前就知道。美国海军资助了波伊兹纳的研究,对利用这些快速的前意识大脑信号感兴趣。读取飞行员的脑电波可以让计算机在飞行员有意识地意识到威胁之前就采取行动。在这种枪战中,最快的枪手甚至不知道他已经扣动了扳机。

波伊兹纳的研究揭示了大约半秒后诱发脑电波中的另一个涟漪,这是大脑思考异常并将异常置于背景环境中的结果。“我们认为这代表了神经处理的第二次传递,”他说。“第一次传递是,有些不对劲。第二次是,哦!好的,我现在已将新信息纳入了我对环境的重建中。”研究人员在非常不同的实验中报告了类似的结果。当受试者听到一句意想不到的话——例如“我的咖啡要加奶油和狗”——时,类似的脑电波反应会在大约同一时间爆发。

寻找通往言语的道路

通过日常经验学习我们的母语非常像对新空间的无监督学习。尽管语言很复杂,但我们所有人在童年时代都仅仅通过体验就掌握了我们的口语。“我们知道,在子宫内,胎儿已经开始学习其语言的特性,”华盛顿大学心理学副教授 Chantel S. Prat 说,她是一位研究语言学习期间大脑变化的领先研究员。根据心理学家莉莲·梅在不列颠哥伦比亚大学领导的 2011 年一项研究,新生儿可以识别母亲的声音,并且更喜欢他们的母语。心理学家芭芭拉·基西列夫斯基和她在安大略省女王大学的同事发现,即使是 33 周到 41 周大的胎儿也会对母亲的声音和一种新的外语表现出惊吓反应,这意味着这些声音在周围的嗡嗡声中引起了他们的注意。

我们常常未能体会到语言的复杂性,因为我们每天都在对话和思想中使用它。但是,当我们尝试学习第二语言时,挑战变得显而易见。

普拉特和她的同事们一直在监测学习第二语言的受试者的脑电波活动,以了解我们如何应对这些挑战。值得注意的是,他们发现脑电波模式本身表明了学生的表现如何。正如在波伊兹纳的研究中一样,普拉特在学习期间观察到的变化发生在特定大脑区域的特定频率的脑电波活动中。经过八周的外语培训后,脑电波的功率不仅在左半球的大脑语言区域布罗卡区增加,而且在右半球的 β 波(频率为 12 至 30 赫兹)中也增加——这是一个惊喜,因为语言通常与大脑的那一侧无关。“变化越大,他们学得越好,”她说。这是一个被证明具有重大意义的惊喜。

读心术

如果思想是存在的本质,那么一些科学家正准备窥探我们的灵魂。也就是说,他们现在可以通过观察某人的大脑活动来了解该人在想什么,这对无监督学习的工作方式具有有趣的意义。卡内基梅隆大学认知大脑成像中心的马塞尔·贾斯特和他的同事们可以可靠地说出一个人是在想椅子还是门,还是一个人心中想的是 1 到 7 中的哪个数字,甚至这个人可能正在感受的情绪——愤怒或厌恶、恐惧或快乐、欲望或羞耻——仅仅通过查看功能性 MRI 扫描。整个大脑中特定神经元集群的活动随着这些概念或情绪中的每一个而增加,并且这些集群在不同人之间出现在相同的位置。

在今年即将发表的研究中,贾斯特正在证明,即使人们在学习抽象概念时,他也能读懂他们的心思。当学生复习大学物理课程的材料时,研究人员能够从学生的 fMRI 中识别出一个人正在关注的 30 个概念中的哪一个。更重要的是,数据表明,不同的抽象科学概念映射到控制可能被认为是类似的,尽管更具体的,功能的大脑区域。例如,学习或思考波的传播方式,会激活与跳舞相同的大脑区域——本质上是节奏模式的隐喻。与运动物理学、向心力、重力和扭矩相关的概念会激活人们观看物体碰撞时反应的大脑区域。似乎抽象概念锚定在由大脑中特定回路控制的离散物理动作上。

这些研究人员开始揭开人类大脑如何表示和保留信息的秘密。这种洞察力正在帮助科学家将信息从大脑传输到机器。例如,世界各地许多实验室的研究人员正在开发由人的思想控制的假肢。计算机检测和分析与肢体运动相关的大脑电波,然后在机器人肢体中激活电动机以产生预期的运动。

下一步听起来有点像诱导心灵感应或瓦肯思维融合。“我们发现你可以使用一个人的大脑信号与另一个人交流,”普拉特说。“我们可以将信息编码到人脑中。”在 2014 年发表的一项引人入胜的研究中,她使用一种称为经颅磁刺激的技术来修改受试者的脑电波,使其呈现出她在另一个人身上观察到的脑电波的形状——实际上是从一个大脑向另一个大脑下载信息。

普拉特在这项未来主义研究中的动机不是弄清楚如何将我脑海中的内容传输到你脑海中;我们已经有非常有效的方法来实现这个目标。事实上,我现在正在这样做,当你阅读这些类型的模式并在你的大脑中重现我的思想时。相反,他们正在尝试测试他们关于大脑中学习和信息加密的发现。

“如果我刺激你的视觉皮层,你看到了,”普拉特说,“你是用你的大脑在看,而不是用你的眼睛。”这一成就将证明她确实破解了大脑对视觉信息的编码。她将在我们的神经科学教科书中写下新的篇章,与关于巴甫洛夫和他的狗的那一章并列。

预测你的未来

在她最新的研究中,普拉特使用脑电图分析达到了一个更加非凡的目的:准确预测哪些学生能够快速学习一门新语言,哪些学生会感到吃力。我们的大脑在休息时所做的事情告诉研究人员很多关于它的布线方式以及它作为一个系统如何运作的信息。与她在语言学习期间右半球 β 波活动的发现相呼应,普拉特发现,一个人在右颞叶和顶叶区域的静息状态脑电图中 β 波的功率越高,学生学习第二语言的速度就越快。原因尚不清楚,但一种可能性是,如果该区域的大多数神经回路都充分参与了各种其他任务,那么许多小组神经元将以各自略有不同的频率振荡,因此任何一个频率的高功率都表明存在大量未开发的池。“他们有点在等待学习一门语言,”普拉特推测。这种倾向非常重要,因为掌握一门新语言与许多认知益处相关,包括提高数学和多任务处理技能。但是,她警告说,我们的大脑不可能在所有方面都擅长:“当你在一件事上变得更好时,它会以牺牲其他事情为代价。”

我向普拉特挑战,让她测量我的脑电波,看看她是否可以预测我学习第二语言的速度。她欣然同意。普拉特和她的研究生布里安娜·山崎将电极应用于我的头部,用盐溶液润湿每个电极,以改善来自我大脑的微小信号的传导。当她测试每个电极时,它会出现在计算机显示器上,当信号强度强时,颜色从红色变为绿色。一旦它们都变成绿色,普拉特说,“闭上眼睛。这将是五分钟。保持静止。”当她调暗灯光并溜出门口时,她说,“放松就好。清空你的思绪。”

我试着这样做,但我的思绪却在飞速运转。这个装置真的能告诉普拉特,当我坐在这里无所事事时,我能多么容易地学习一门新语言吗?我想起了波伊兹纳在他的 VR 实验室里对我做出的类似吹嘘——他可以根据人们在坐着让思绪飘荡时的大脑活动 fMRI 扫描来预测他们在他的空间学习实验中的表现。这种所谓的大脑静息状态 fMRI 是指人们在什么都不做,只是让思绪飘荡时的大脑活动,它不同于熟悉的大脑对特定刺激的反应的 fMRI 研究。事实上,在对一群人进行此类读数几个月后,波伊兹纳将他们带到 VR 试验中,发现那些更快学会虚拟储藏室布局的人的静息状态 fMRI 记录显示,负责视觉空间处理的大脑网络的功能整合更紧密。

五分钟过去了。普拉特和山崎回来了。“你得到好的数据了吗?”我问。

“这比平均水平略低,”普拉特看着我微弱的 β 波说。然后她调出她自己的脑电波记录,该记录显示 α 频段出现了一个尖峰。它看起来有点像股票市场图表中的尖峰。相反,我的大脑显示功率转移到更高的频率,这是大脑皮层信息处理的特征。我显然无法放松并让我的思绪休息。

“我是个好的第二语言学习者吗?”我问。

“不,”普拉特说。“你的斜率大约是 0.5,平均水平大约是 0.7。”

这是真的。我在高中时学过西班牙语,在大学时学过德语,但它们并没有真正扎根。这比塔罗牌还令人毛骨悚然。“肯定有好处,”我说。

“当然……很多好处。”

“告诉我一个。”

“你非常沉浸在你的第一语言中。”

我呻吟了一声。然后她补充说,“β 波功率与阅读的关系正好相反。你可能是一位优秀的读者。”

在我回到实验室几天后,剑桥大学的托马斯·福尔克和他的同事们发表了一篇新论文,报告说,单语者在元认知或思考思考方面优于双语者,并且他们在犯错后更擅长纠正自己的表现。

我感觉好多了。思考思考并从失败的实验中学习:这正是我作为神经科学家所做的事情。你可以在我的简历中读到这一点——也可以在我的脑电波中读到。

更多探索

自由探索期间的人类皮层 Θ 编码空间并预测后续记忆。 约瑟夫·斯奈德等人在神经科学杂志第 33 卷第 38 期,第 15,056–15,068 页;2013 年 9 月 18 日。

从大脑激活模式解码数值表示。 Saudamini Roy Damarla 和 Marcel Adam Just 在人类大脑图谱第 34 卷第 10 期,第 2624–2634 页;2013 年 10 月。

人类直接脑对脑接口。 Rajesh P. N. Rao 等人在 PLOS ONE 第 9 卷第 11 期,文章编号 e111332;2014 年 11 月 5 日。

神经系统可塑性的新机制:活动依赖性髓鞘形成。 R. Douglas Fields 在自然评论神经科学第 16 卷,第 756–767 页;2015 年 12 月。

元认知处理中的双语劣势。 Tomas Folke 等人在 Cognition 第 150 卷,第 119–132 页;2016 年 5 月。

来自我们的档案

当两个大脑连接时。 Rajesh P. N. Rao 和 Andrea Stocco;2014 年 11 月/12 月。

R. Douglas Fields 是马里兰大学帕克分校神经科学和认知科学项目的兼职教授。他是获奖书籍 Electric Brain The Other Brain 的作者。

更多作者:R. Douglas Fields
SA Mind Vol 27 Issue 5本文最初以“无人监督时的学习”为标题发表于 SA Mind 第 27 卷第 5 期(),第 56 页
doi:10.1038/scientificamericanmind0916-56
© . All rights reserved.