自我实验者:20万小时的婴儿语能解开机器人的舌头吗?

德布·罗伊希望通过让机器人模仿他的孩子来使机器人更智能

这是我们关于自我实验者的网络专题报道的八篇文章中的第五篇。

当德布·罗伊和他的妻子有可能会遇到他们两岁半儿子的过夜客人时(为了保护孩子的隐私,他们没有透露孩子的名字)—他们做的第一件事就是要求访客填写一份同意书。当然,这很不寻常,但这对夫妇只是想让人们意识到他们的行为和声音可能会被安装在他们位于马萨诸塞州剑桥市的家中,并隐藏起来的11个鱼眼摄像头和14个麦克风捕捉到。 这些设备几乎监听着他们儿子发出的每一个声音。

这种设置的两个主要目标是:了解儿童如何习得语言,并将收集到的智能用于教机器人说话。

39岁的罗伊是麻省理工学院媒体实验室认知机器组的负责人,他正在记录他称之为“人类语音组项目”中每次的亲子“对话”。他估计,到今年晚些时候完成该项目的录音阶段时,他将收集到估计20万小时的视频和多轨音频数据——约占孩子生命最初两年的70%清醒时间,以及第三年的一部分。

罗伊在对一个名为托科的特定机器人的机器人研究陷入僵局后启动了这个项目。作为麻省理工学院媒体实验室的研究生,他想教机器人说话,因此他为托科编程了精密的图像语音处理软件,并结合了他希望奏效的机器学习算法。但是,当罗伊将一个球放在托科的摄像头前时,他意识到机器无法理解“球”(物体)和“圆形”(物体的属性)含义之间的区别,这两者在其计算机内存中都以相同的方式表示。

他认为,克服这个问题的首要步骤是弄清楚幼儿如何学习解决同样的问题。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。 通过购买订阅,您正在帮助确保未来能够继续产出关于塑造我们当今世界的发现和想法的有影响力的报道。


研究人员之前曾尝试解开语言习得的过程,通常是在实验室或家庭环境中,对母亲和她们的孩子进行几个小时的窃听。但是,从如此有限的观察中很难得出任何确凿的结论。“在发展心理学中,长期以来一直存在一种权衡,即从少数儿童那里收集大量数据,或者从大量儿童那里收集少量数据,”哈佛大学语言学家史蒂芬·平克说道,他几年前也提出了类似的想法。在像罗伊这样的案例中,“当扩展到更大的样本时,只要关注正常儿童不太可能表现出巨大个体差异的基本问题,这些发现就能很好地成立。”

罗伊是一位受过训练的工程师,他计划将他庞大的数据集进行严格的分析,以试图找出他、他的妻子(鲁帕尔·帕特尔,波士顿东北大学的言语语言病理学教授)和孩子在教授和学习共同概念时的说话方式的模式。(他指出,当你的父母都是教授时,“你可能不得不听很多谈话。”)他希望通过研究某些线索来重建使儿童逐渐将意义附加到单词和表达的心理过程:说了什么词(例如,“食物?”);谁说的(帕特尔);说话者当时想要什么(让孩子坐到高脚椅上);以及孩子的反应(“不”)。

罗伊不习惯24/7地观察他人,他选择将项目限制在家庭内部(并征得帕特尔的同意)。 并非他们的生活完全透明。“糟糕按钮”允许这对夫妇删除他们宁愿不记录的事情。 作为进一步的保障,音频记录被分解并以随机片段的形式发送给一群转录员,这限制了他们重建这对夫妇家中事件的能力。

对这座婴儿语“高塔”的分析才刚刚开始,但罗伊已经开始意识到将该项目扩展到其他志愿者需要做些什么——例如,帮助有沟通问题的孩子的家庭。“如果我们想扩大研究范围或帮助其他人进行类似的研究,”他说,“我们知道哪些伦理问题是重要的。”

© . All rights reserved.