计算机现在比人类更擅长识别模式

一种人工智能方法,使计算机识别视觉模式的能力优于人类

加入我们的科学爱好者社区!

如果有人向您展示一个来自不熟悉字母表的字符,并要求您将其复制到一张纸上,您可能可以做到。但是,即使配备了最先进的深度学习算法(例如谷歌用于分类照片的算法),计算机也会束手无策。这些机器学习系统需要对大量数据集进行训练,才能对图像进行最基本的区分。这对于邮局中按邮政编码对信件进行分类的机器来说可能很好。但对于更微妙的问题,例如即时语言翻译,从少量示例中学习的方法会更有效率。

由于一种名为贝叶斯程序学习(BPL)的机器学习框架,计算机正接近实现这一飞跃。纽约大学、麻省理工学院和多伦多大学的一个研究团队表明,使用BPL的计算机在基于单个示例的暴露来识别和重新创建不熟悉的手写字符集方面,可以比人类表现更好。(“贝叶斯”指的是一种概率推理,可以用来根据新的证据更新不确定的假设。)

BPL机器学习方法从根本上不同于深度学习,后者大致模拟了人脑的基本模式识别能力。相反,BPL从人脑推断可能产生给定模式的一组动作的能力中获得灵感。例如,它会识别出字母A可以由两个在顶部连接的倾斜笔画构成,中间有一个短的水平笔画。“计算机通过组装一个简单的程序来表示A,该程序生成该字母的示例,每次运行代码时都会有不同的变体,”纽约大学的摩尔-斯隆数据科学研究员布伦丹·莱克说,他参与了这项研究。贝叶斯过程允许软件应对从较小的、先前已知的部分(例如,A中的水平笔画)重新创建不熟悉的字母的不确定性。


支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


这种机器学习更通用,也更高效。BPL软件用于解构然后重新创建未知字母的相同过程,有朝一日可以为AI应用程序提供动力,这些应用程序可以推断复杂现象(例如河流的流动)中的因果模式,然后使用它们来解决完全不同的系统。人类经常使用这种抽象的“横向思维”;BPL可以为计算机解锁类似的能力。“我们正在努力让计算机能够学习可以应用于许多不同任务或领域的概念,”莱克说。“这是人类智能的核心方面。”

约翰·帕夫勒斯是一位专注于科学、技术和设计的作家和电影制作人。他的作品曾发表在《彭博商业周刊》、《麻省理工科技评论》和《美国最佳科学与自然写作》系列中。他住在俄勒冈州波特兰市。

更多作者:约翰·帕夫勒斯
大众科学杂志 第315卷 第6期本文最初以“8. 视觉阅读软件”为标题发表于《大众科学》杂志 第315卷 第6期(),第41页
doi:10.1038/scientificamerican1216-39b
© . All rights reserved.