科学家如何利用人工智能与动物对话

便携式传感器和人工智能正在帮助研究人员解码动物交流——并开始与非人类对话

Portrait of Karen Bakker in nature

艾琳·里纳尔迪

在 20 世纪 70 年代,一只年轻的名为科科的大猩猩因其使用人类手语的能力而引起了全世界的关注。但怀疑论者认为,科科和其他“学会”说话的动物(包括黑猩猩和海豚)可能并不真正理解它们在“说”什么——并且试图让其他物种使用人类语言,在人类语言中,符号代表可能不在物理上存在的事物,是徒劳的。

不列颠哥伦比亚大学教授、哈佛大学拉德克利夫高级研究院院士凯伦·巴克说:“有一组研究人员热衷于找出动物是否可以进行符号交流,而另一组研究人员则说,‘那是拟人化。我们需要按照非人类交流本身的条件来理解它。’” 现在,科学家们正在使用改进的传感器和人工智能技术来观察和解码各种物种,包括植物,如何使用它们自己的方法分享信息。巴克 2022 年出版的著作《生命之声:数字技术如何让我们更接近动物和植物的世界》(普林斯顿大学出版社)的主题就是“数字生物声学”领域。

《大众科学》与巴克谈论了技术如何帮助人类与生物交流,例如蝙蝠蜜蜂——以及这些对话如何迫使我们重新思考我们与其他物种的关系。


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


[以下是采访的编辑稿。]

您能简要介绍一下人类尝试与动物交流的历史吗?

在 20 世纪中期,人们曾多次尝试将人类语言教给非人类,例如科科这样的灵长类动物。这些努力有些争议。当我们回顾过去时,我们现在有一种观点(当时可能并不那么流行),即我们在方法上过于以人类为中心。当时的愿望是通过教非人类像我们一样说话来评估非人类的智力——但事实上,我们应该思考它们以自己的方式、以自己的具体方式、以自己的世界观进行复杂交流的能力。

本书中使用的术语之一是环境的概念,这是指生物体的生活体验。如果我们关注另一个生物体的环境,我们就不会期望蜜蜂说人类语言,但我们会对蜜蜂迷人的语言非常感兴趣,这种语言是振动和位置性的。它对我们甚至无法用我们的身体传达的细微差别很敏感,例如阳光的偏振。这就是今天的科学发展方向。数字生物声学领域——正在呈指数级加速发展,并揭示关于生命之树中交流的有趣发现——现在正在接近这些动物,并询问的不是“它们能像人类一样说话吗?”而是“它们能彼此交流复杂的信息吗?它们是如何做到的?什么对它们来说是重要的?” 我会说这是一种更以生物为中心的方法,或者至少它不那么以人类为中心。

从更宏大的角度来看,我认为承认倾听自然,“深度倾听”,具有悠久而值得尊敬的传统也很重要。这是一种古老的艺术,至今仍以未被媒介化的形式实践。长期以来,原住民就拥有深度倾听的传统,他们非常关注非人类的声音。因此,如果我们将数字监听——它正在开辟非人类声音的广阔新世界,并使用人工智能解码这些声音——与深度倾听相结合,我相信我们正处于两项重要发现的边缘。第一个是发现非人类的语言。这是一个非常有争议的说法,我们可以深入探讨。第二个是:我相信我们正处于物种间交流的边缘。

是什么样的技术正在促成这些突破?

数字生物声学依赖于非常小巧、便携、轻便的数字录音机,这些录音机就像微型麦克风,科学家们正在从北极到亚马逊的各个地方安装。您可以将这些麦克风放在海龟或鲸鱼的背上。您可以将它们放入深海或最高的山顶,或者将它们连接到鸟类身上。它们可以 24/7 全天候在科学家难以到达的偏远地区,甚至在黑暗中连续录音,而且不会产生引入人类观察员到生态系统中所带来的干扰。

这种仪器产生了大量数据,这就是人工智能发挥作用的地方——因为我们在 Google 翻译等工具中如此有效地使用的相同自然语言处理算法也可以用于检测非人类交流中的模式。

这些交流模式的一个例子是什么?

在我讨论特拉维夫大学的约西·约维尔的研究的蝙蝠章节中,有一项特别的研究,他的团队监测了[近两]打埃及果蝠两个半月,并记录了它们的叫声。然后,他们调整了一个语音识别程序来分析[15,000 个]声音,并且该算法将特定的声音与通过视频捕获的特定社交互动相关联——例如当两只蝙蝠争夺食物时。通过这个,研究人员能够对大多数蝙蝠的声音进行分类。这就是约维尔和其他研究人员(例如俄亥俄州立大学的格里·卡特)如何能够确定蝙蝠的语言比我们以前理解的要复杂得多的原因。蝙蝠会为食物争吵;它们在彼此交流时区分性别;它们有个人名字,或“签名呼叫”。母蝙蝠用相当于“母亲语”的方式与它们的幼崽说话。但是,当人类母亲与婴儿说话时会提高音调,而母蝙蝠则会降低音调——这会在婴儿身上引发咿呀学语的反应,随着婴儿长大,它们会学会“说”特定的词语或指代表达信号。因此,蝙蝠会进行声音学习。

这是一个很好的例子,说明深度学习如何能够从这些仪器、所有这些传感器和麦克风中推导出这些模式,并向我们揭示我们用肉眼无法获得的东西。因为大多数蝙蝠交流都在超声波范围内,超出我们的听力范围,并且因为蝙蝠说话速度比我们快得多,所以我们必须放慢速度才能听到它,并降低频率。因此,我们无法像蝙蝠一样聆听,但我们的计算机可以。下一个见解是,我们的计算机也可以与蝙蝠对话。该软件产生特定的模式,并使用这些模式与蝙蝠群或蜂巢进行交流,而这正是研究人员现在正在做的事情。

研究人员是如何与蜜蜂对话的?

蜜蜂研究非常有趣。柏林自由大学的研究员蒂姆·兰格拉夫研究蜜蜂的交流,正如我之前提到的,它是振动和位置性的。当蜜蜂彼此“交谈”时,重要的是它们的身体动作以及声音。现在,计算机,特别是深度学习算法,能够跟踪这一点,因为您可以使用计算机视觉,结合自然语言处理。他们现在已经完善了这些算法,以至于他们实际上能够跟踪单个蜜蜂,并且他们能够确定一个个体的交流可能对另一只蜜蜂产生什么影响。由此产生了破译蜜蜂语言的能力。我们发现它们有特定的信号。研究人员给这些信号起了有趣的名字。蜜蜂会嘟嘟叫;它们会嘎嘎叫。有一种“嘘”或“停止”信号,一种高亢的“危险”信号。它们有(与蜂群分蜂相关的)鸣笛信号以及乞求和摇晃信号,所有这些都指导着集体和个体行为

兰格拉夫的下一步是将这些信息编码到一个名为 RoboBee 的机器人中。最终,经过七到八个原型,他提出了一个可以进入蜂巢的“蜜蜂”,它基本上会发出蜜蜂会服从的命令。因此,兰格拉夫的蜜蜂机器人可以告诉其他蜜蜂停止,它们就会停止。它还可以做一些更复杂的事情,即非常著名的摇摆舞——这是它们用来向其他蜜蜂传达花蜜来源位置的交流模式。这是一个很容易进行的实验,在某种程度上,因为你把花蜜来源放在一个蜂巢中没有蜜蜂访问过的地方。然后,你指示机器人告诉蜜蜂花蜜来源在哪里,然后你检查蜜蜂是否成功飞到那里。的确,它们做到了。这个结果只发生过一次,科学家们不确定它为什么会起作用或如何复制它。但这仍然是一个惊人的结果。

这引发了很多哲学和伦理问题。您可以想象这样的系统可以用来保护蜜蜂——您可以告诉蜜蜂飞往安全的花蜜来源,而不是飞往受到污染的花蜜来源,例如,这些花蜜来源的农药含量很高。您还可以想象这可能是一种驯化以前我们只是不完全驯化的野生物种,或试图控制其他野生物种行为的工具。关于非人类的复杂程度和复杂交流程度的见解,引发了一些非常重要的哲学问题,即语言作为人类能力的独特性。

这项技术对我们理解自然世界有什么影响?

数字生物声学的发明类似于显微镜的发明。当荷兰科学家安东尼·范·列文虎克开始通过他的显微镜观察时,他发现了微生物世界,这为无数未来的突破奠定了基础。因此,显微镜使人类能够用我们的眼睛和我们的想象力重新观看。这里的类比是,数字生物声学与人工智能相结合,就像一个行星尺度的助听器,使我们能够用我们经过修复增强的耳朵和我们的想象力重新聆听。这正在慢慢打开我们的思想,不仅让我们认识到非人类发出的美妙声音,而且让我们认识到关于所谓的人类与非人类之间的鸿沟、我们与其他物种的关系的一系列基本问题。它还开辟了思考保护和我们与地球关系的新方式。这非常深刻。

索菲·布什威克大众科学的科技编辑。她负责网站的每日科技新闻报道,撰写从人工智能到跳跃机器人等各种文章,用于数字和印刷出版物,录制 YouTube 和 TikTok 视频,并主持播客科技速递。布什威克还经常出现在广播节目(如科学星期五)和电视网络(包括哥伦比亚广播公司、MSNBC 和国家地理频道)中。她拥有在纽约市担任科学记者的十多年经验,并且曾在大众科学发现和 Gizmodo 等媒体工作过。在 X(以前称为 Twitter)上关注布什威克 @sophiebushwick

更多作者:索菲·布什威克
大众科学杂志 第 328 卷 第 5 期本文最初以“科技与动物对话”为标题发表于大众科学杂志 第 328 卷 第 5 期 (), p. 26
doi:10.1038/scientificamerican0523-26
© . All rights reserved.