本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点
人们家中已经拥有比许多智能动物物种总数还多的机器人吸尘器。尽管这些机器在简单的任务上很有效,但它们还没有我们的任何宠物那么聪明。它们只有几个传感器,并且对它们所处的世界实际上了解甚少。
尽管如此,许多初创公司和老牌公司都希望制造更复杂的家用机器人,因为人们相信开发家用自动化设备将是一个巨大的增长领域。我认为这种趋势将继续下去,主要受到日本、韩国、欧洲、北美甚至中国快速老龄化人口的推动。 然而,为了帮助我们安度晚年,下一代家用机器人将拥有比现有家用机器人更丰富的感官世界。

《杰森一家》中的机器人女仆罗西;2012年圣地亚哥动漫展的cosplay。图片来源:Pat Loika Flickr(CC BY-SA 2.0)
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们今天世界的发现和想法的有影响力的故事的未来。
我们人类知道我们如何感知世界,我们意识到什么,以及什么引起我们的注意。我们的感官世界与我们的狗的感官世界非常不同。我们知道,与我们相比,我们的狗有非常灵敏的嗅觉,并且它们受到气味的驱动,这是我们永远无法做到的。尽管它们的鼻子可能比我们的灵敏一百万倍,但它们喜欢把鼻子伸到我们永远不想放的地方。它们这样做是因为它们可以从我们相对不发达的嗅觉中了解到我们永远无法了解到的关于世界的知识。相比之下,然而,我们的视力比狗的视力好得多;我们有更好的视敏度,我们的色觉范围包括红色,这是狗完全失去的东西,它们只是把我们鲜艳的红色看作是灰色的阴影。我们是视觉动物;狗是嗅觉(和有气味的)动物。
那么,未来的家用机器人将如何感知世界,它们的世界观将与我们的有何不同? 成为人类家中的机器人会是什么感觉? 机器人生物会是什么样的?
手机的世界观
家用机器人的新传感器世界将主要受到过去10年智能手机取得的成功、某些传感器价格下降和性能提升以及低功耗、物理尺寸小的计算单元的可用性驱动。让我们尝试一个思想实验,看看像智能手机一样看世界会是什么样子。
现代智能手机的内部构造,不包括实际的摄像头、昂贵的触摸屏、扬声器和麦克风,不包括高性能电池和精美的机加工金属外壳,零售价约为100到200美元。三星和高通是最大的手机芯片制造商之二,它们以零售价出售电路板,没有大量订单的折扣,这些电路板拥有现代手机的大部分其余部分,价格约为100美元。这包括八个高性能64位处理器、两个高清摄像头的内部电路、用于渲染照片和视频的GPU(图形处理单元)、驱动屏幕的硬件电路、用于查找面部并聚焦于面部的专用硅电路、专用语音处理和声音生成硅、大量计算机内存、用于保护代码和数据免受外部攻击的加密硬件以及Wi-Fi蓝牙驱动程序和天线。缺少的是GPS系统、运动传感器、用于Apple Pay等服务的近场通信以及连接到蜂窝网络的射频硬件。四舍五入到200美元以包括一个单元中的所有东西将是一个安全的赌注。
任何考虑在未来五年内制造家用机器人的人,如果不利用手机技术和生产设备的制造基础设施,那将是疯了。单板的200美元在构建家用机器人的内部结构方面取得了巨大的进步。因此,这种与手机相关的技术将在很大程度上推动我们即将到来的家用机器人在未来十年左右的感官世界,并且鉴于手机本身在过去几十年中发生了变化,手机可能会继续更广泛地为许多技术设定步伐。不要惊讶在未来几年看到手机中出现更多的硅,以测试深度学习等人工智能技术。它们目前的GPU已经非常适合这一点,但更智能的手机将竞争机器学习如何应用于手机所有者的便利和享受的实际问题。
可能会有添加到家用机器人中的其他传感器,这些传感器不在手机中,它们将连接到机器的处理器并在设备中处理它们的数据,从而增加它们的感官世界。机器人感知到的很多东西将来自摄像头、麦克风和移动电话的无线电频谱收发器(发射和接收单元)。在即将到来的用于高端智能手机的5G手机芯片组中,总共将有九个不同的无线电系统。
即使仅配备100美元的精简手机系统,我们的家用机器人也能够“嗅到”我们的蓝牙设备、我们的Wi-Fi接入点以及任何使用Wi-Fi的设备。 当我环顾我的房子时,我看到了Wi-Fi打印机、笔记本电脑、平板电脑、智能手机以及连接到我的电视的Roku设备(更新的“智能电视”具有直接的Wi-Fi连接)。我已经拥有了一系列活动的蓝牙设备,包括电脑鼠标、键盘、秤、Fitbit、手表、扬声器等等。我们家用机器人的感官世界将包括所有这些设备;当它们驶过时,它们会注意到它们,就像我们注意到我们身处绿色卧室或蓝色餐厅一样。其中一些蓝牙设备将位于固定位置,一些将随人移动。有些将链接到特定的人,这个人也可能通过机器人上的摄像头定位。但是机器人会眼观六路,耳听八方。即使不将其摄像头指向某个方向,它也可能能够仅从其蓝牙签名中知道特定的人正在接近。
凭借这种感官世界以及对蓝牙信号的少量处理,我们的家用机器人可以唤起与我们使用手机时完全不同的世界观。对我们人类来说,我们的设备是一种交流的手段,但对我们的机器人来说,它们将是地理和个人标签,即使只查看信号中的一小部分信息也可以破译它们。
根据谁制造机器人以及谁对其进行编程,他们可能能够提取比仅仅将我们区分为可识别的人更多关于我们的信息。也许他们将有能力监听我们的通信内容,无论是我们今天走了多少步,还是我们输入到计算机中的单词,还是通过我们家中的Wi-Fi传入的电子邮件。
近年来,迪娜·卡塔比和她在麻省理工学院计算机科学与人工智能实验室(CSAIL,我直到2007年都是该实验室的主任)的学生一直在试验使用Wi-Fi中使用的无线电信号——但不是这些信号携带的实际数字内容。每部手机都必须执行这种类型的处理,但它们主要只是想获取内容,并可能保持连接的质量。如果Wi-Fi信号不强,或者如果有太多其他设备尝试使用相同的频段,则手机可能会选择切换到另一个更清晰的无线电频率。
卡塔比和她的学生利用手机中嵌入的处理能力来确定无线电波到达设备可能采取的多条路径的定时如何微妙地变化。他们用它来检测人们的心跳和呼吸变化如何非常轻微地影响信号的定时。改变的信号可能表示一个人情绪状态的波动。(请注意,这不需要任何连接到某人身体的传感器——无线电收发器只是检测人的身体存在如何改变Wi-Fi信号的行为。)我们未来的家用机器人可能会以人们永远无法做到的方式直接读取我们。它们将检测生活空间内的每个人,并不断感知诸如心率和呼吸等指标。
如果芯片组使用智能手机拥有的全套通信通道,那么机器人的感官世界将更加丰富。使用GPS,即使在室内,机器人也会大致知道其全球坐标。它将可以访问任何智能手机使用的各种服务,包括一天中的时间、日期以及当前的天气,无论是在本地还是在世界其他地方。它会知道外面是黑夜,因为时间是晚上并且是一年中的某个时候,而不是因为天黑或天亮了多久才知道时间。人类以其他方式获得这类信息。我们知道我们是在室内还是室外,不是通过GPS坐标和详细地图,而是通过对光线的感知、空气的流通方式以及声音的反射方式。这些感官输入是我们主观体验的一部分。
如果我们的机器人绕过我们通过直接技术访问信息来体验世界的方式,它们将很难理解我们的局限性。如果遥远的未来,它们达到了自己的意识水平,它们可能对我们没有多少同情心。而且,如果发生可怕的基础设施破坏事件,例如卫星袭击或核战争,我们的机器人将在我们最需要它们的时候变得无能为力——这是我们在设计它们时应该思考的一种情况。
借助5G的额外无线电频率,将有可能比较许多无线域中不同信号的到达时间。这种发展将使机器开始了解有关建筑环境的事物——墙壁是由混凝土还是木材建造的,或者附近的大型金属移动物体是卡车还是公共汽车。如果我们家用机器人的建造者决定将所有这些都编入程序,那么机器将被赋予一种对周围世界的超感。
我们机器人上的摄像头可以很容易地选择扩展它们看到的光的范围,进入紫外线和红外线光谱。在后一种情况下,它们将能够看到我们最近坐在哪里,也许可以通过跟踪热轨迹来看到我们走过的路。这种能力将证明它们拥有另一种我们没有的奇怪感觉。
机器人也可能利用开始在我们家中普及的设备,我们的亚马逊Echo和我们的谷歌Home,甚至我们的智能电视,它们可以随时收听我们。家用机器人——在其服务条款中,我们可能会在不阅读的情况下同意签署——很可能可以访问这些设备正在收听的内容。它也可能链接到我们智能烟雾探测器上的摄像头正在看到的内容,在我们回家之前在我们的汽车中发生了什么,我们刚刚在哪里使用我们的电子钱包购买东西,以及也许我们购买了什么。家用机器人可能具有感知我们生活中事物的能力,这是最严厉的青少年子女的父母也只能想象的。
它们知道什么
因此,对于我们的家用机器人来说,感官世界可能与我们非常不同。它们会知道我们无法知道的事情,但它们也可能缺乏对我们主观体验的理解。它们与我们建立联系的能力将在很大程度上取决于它们的感知处理与我们的感知处理的对齐程度。这就是思考未来机器人的感官世界最终变得非常模糊的地方。
我们如何解释我们感知到的世界,这受到了一生的经验的影响,这些经验既包括感知也包括行动。我们的新型家用机器人很可能通过深度学习网络来解释它们的传感器,为它们看到(或无线电感知)的东西提供标签,例如“烤箱”或“冰箱”或“厕所”。深度学习可以轻松提供这种程度的理解。 但是它们,机器人,将不具备我们拥有的更敏锐的理解力。 我们知道,当我们把东西放进烤箱,稍后取出时,它的外观可能会完全改变——这只是我们丰富的常识知识的一个例子。目前,机器学习技术无法处理这类知识,因此我们的机器人在相当长一段时间内将对世界的真实运作方式相当幼稚。
我们和我们的机器人将在我们共同的家中拥有不同的感官世界。我们越了解我们的机器人助手的世界,我们就越能对它们应该能够做什么抱有切合实际的期望,以及我们应该委托和委托给它们什么,以及通过拥有它们在我们身边而放弃的隐私的哪些方面。如果我们在它们身上构建人类感官世界的合理模型,它们将更好地预测我们能知道和将要做什么,从而顺利我们的互动。
至少在未来几十年内,我们的机器人将缺乏自我意识、主观体验、融入这些主观体验的情景记忆,或者任何类似意识的迹象,就像我们可能认为我们的狗具有某种形式的意识一样。第一代家用机器人(机器人吸尘器是第一代)在它们的行为以及与我们的互动中将更像昆虫而不是哺乳动物。它们将根本不像我们。
也许随着越来越多的人开始研究如何赋予机器人主观体验和类似意识的体验,我们将开始与我们的机器建立一种同理心。或者,也许我们和我们的机器人将永远更像章鱼和潜水员:一个在另一个的世界中并不完全舒适,不像在那个世界的细节中那样敏捷和有意识。这两个生物彼此意识到对方,但从未真正互动。