如果您毕业后停止学习会怎样?这听起来令人窒息,但这正是大多数机器学习系统的训练方式。它们掌握一项任务后便会被部署。但是,一些计算机科学家现在正在开发能够像人脑一样持续学习和适应的人工智能。
机器学习算法通常采用神经网络的形式,神经网络是由大量简单的计算元件(或神经元)组成的,这些元件通过强度或“权重”各不相同的连接进行通信。考虑一种旨在识别图像的算法。如果在训练期间错误标记图片,则会调整权重。当错误减少到某个阈值以下时,权重会冻结在设定值。
这项新技术将每个权重分成两个值,这两个值结合起来影响一个神经元可以激活另一个神经元的程度。第一个值像传统系统中一样被训练和冻结。但是,第二个值会根据网络中周围的活动不断调整。关键的是,该算法还会学习如何调整这些权重。因此,神经网络学习行为模式,以及在面对新情况时如何调整该行为的每个部分。研究人员于七月在瑞典斯德哥尔摩的一次会议上介绍了他们的技术。
关于支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和想法的具有影响力的故事。
应用该技术,该团队创建了一个网络,该网络在仅看到几次完整图像后,便学会了重建半擦除的照片。相比之下,传统的神经网络需要看到更多的图像才能重建原始图像。研究人员还创建了一个网络,该网络在看到一个示例后,便学会了识别手写字母(与印刷字母不同,手写字母是不均匀的)。
在另一项任务中,神经网络控制一个角色在简单的迷宫中移动以寻找奖励。经过一百万次试验,具有新型半可调权重的网络每次试验找到每个奖励的次数是仅具有固定权重的网络的三倍。半可调权重的静态部分显然学习了迷宫的结构,而动态部分则学习了如何适应新的奖励位置。“这非常强大,”加州大学伯克利分校的计算机科学家 Nikhil Mishra 说,他没有参与这项研究,“因为算法可以像人类一样更快地适应新任务和新情况。”
优步乘车共享公司的计算机科学家兼论文的主要作者托马斯·米科尼表示,他的团队现在计划处理更复杂的任务,例如机器人控制和语音识别。在相关工作中,米科尼希望模拟“神经调节”,这是一种即时的全网络适应性调整,使人类能够在发生新颖或重要的事情时吸收信息。