借助iPhone的Siri等语音识别软件,机器人已经可以识别并对语音做出反应。但是,“智能”机器仍然难以处理大多数其他声音。“从某种意义上说,这几乎是一个更简单的问题,但是对于环境中的噪声,还没有进行大量研究,”波士顿Rethink Robotics的机器人专家约瑟夫·罗马诺说。“它还没有被纳入机器人反馈的循环中。”
现在,罗马诺正在让机器人倾听比我们的对话更多的声音。他和他在宾夕法尼亚大学的合作者创建了一个名为ROAR(robotic operating system open-source audio recognizer,机器人操作系统开源音频识别器 的缩写)的软件工具,该工具允许机器人专家训练机器对更广泛的声音做出反应。正如最近一期Autonomous Robots杂志中所述,该工具的主要要求是麦克风。
为了开始训练,机器人的麦克风首先捕获环境声音,ROAR会清除嘈杂的静电。接下来,操作员通过重复执行特定操作(例如关门或启动智能手机闹钟)并标记独特的音频特征(在机器人监听时)来教ROAR识别关键声音。最后,程序从该组训练片段中创建每个动作的声音的通用模型。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的有影响力的故事的未来。
该小组在一个单臂机器人上测试了ROAR,提高了机器完成特定任务的能力。在一种情况下,机器人试图自主抓取并启动电钻。在没有任何声音反馈的情况下,机器人仅在20次尝试中成功了9次,但在使用ROAR时,其成功率提高了一倍。如果在抓取后,机器人没有听到电动机的嗡嗡声,它会调整抓握并再次尝试。
下一步是确保系统在嘈杂的环境中工作。将音频与视觉和触觉线索一起集成到机器人的反馈循环中,有一天可以使机器人护士快速响应求救呼叫,或使工厂机器人在发生故障时做出反应。尽管这项技术仍处于早期阶段,但罗马诺认为其潜力巨大。“我们甚至还没有开始探索我们可以做什么,”他说。