在过去的30年里,计算机视觉技术一直难以在视觉任务方面帮助人类,即使是像准确识别照片中的人脸这样平凡的任务。然而,最近,深度学习(人工智能的一个新兴领域)的突破终于使计算机能够像人类一样成功地解读多种图像,甚至比人类做得更好。公司已经开始销售利用这项技术的产品,这项技术很可能接管或辅助人们现在执行的各种任务,从驾驶卡车到阅读扫描结果以诊断疾病。
深度学习方法(称为卷积神经网络 (CNN))的最新进展是最新进步的关键。举一个简单的例子来说明它的威力,可以考虑动物的图像。人类可以很容易地区分猫和狗,而卷积神经网络使机器能够比人类更成功地对特定品种进行分类。它之所以出色,是因为它能够更好地学习并从图像中细微的、有意义的模式中推断出结论。
卷积神经网络不需要被编程来识别图像中的特定特征——例如,动物耳朵的形状和大小。相反,它们通过训练自主学习识别这些特征。例如,要训练卷积神经网络将英国激飞猎犬与威尔士激飞猎犬区分开来,你需要从数千张动物图像开始,包括这两种犬的例子。像大多数深度学习网络一样,卷积神经网络也是分层组织的。在较低的层中,它们从图像中学习简单的形状和边缘。在较高的层中,它们学习复杂和抽象的概念——在本例中,是耳朵、尾巴、舌头、毛发纹理等特征。经过训练后,卷积神经网络可以轻松地判断动物的新图像是否显示出感兴趣的品种。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保关于塑造当今世界的发现和想法的具有影响力的故事的未来。
卷积神经网络的实现得益于过去十年图形处理单元和并行处理的巨大进步。但互联网也通过满足卷积神经网络对数字化图像的巨大需求,产生了深远的影响。
基于深度学习的计算机视觉系统正在为各种应用而开发。该技术通过增强识别行人的能力,使自动驾驶汽车更加安全。保险公司开始应用深度学习工具来评估汽车的损坏程度。在安全摄像头行业,卷积神经网络使理解人群行为成为可能,这将使公共场所和机场更加安全。在农业领域,深度学习应用程序可用于预测作物产量、监测水位并帮助在作物病害蔓延之前发现它们。
深度学习在视觉任务方面正在医学领域取得一些最广泛的进展,它可以加快专家对扫描和病理切片的解读速度,并在缺乏训练有素的专业人员来读取图像的地方提供关键信息——无论是用于筛查、诊断还是监测疾病进展或对治疗的反应。例如,今年,美国食品和药物管理局批准了初创公司 Arterys 的一种深度学习方法,用于可视化心脏中的血流;目的是帮助诊断心脏病。同样在今年,斯坦福大学的 Sebastian Thrun 和他的同事在《自然》杂志上描述了一种系统,该系统对皮肤癌的分类与皮肤科医生一样好。研究人员指出,这种安装在智能手机上的程序(在世界各地普遍存在)可以提供“低成本的普遍获得重要诊断护理的机会”。目前,还在开发用于评估糖尿病视网膜病变(一种失明原因)、中风、骨折、阿尔茨海默病和其他疾病的系统。