辨别真伪:人工智能可以生成栩栩如生的照片

通过让人工智能互相竞争,科技公司正在创造逼真的计算机生成图像

英伟达的一个研究团队使用人工神经网络,基于数十万张真实名人的照片,创建出越来越逼真的图像。

英伟达

欺诈性图像与摄影术本身一样古老。 以著名的科廷利仙女或尼斯湖水怪的恶作剧照片为例。 Photoshop 将图像处理技术带入了数字时代。 现在,由于人工神经网络的算法可以分析数百万张真实人物和地点的照片,并使用它们来创建令人信服的虚构照片,人工智能有望将照片造假提升到一个新的水平。

这些网络由相互连接的计算机组成,这些计算机以类似于人脑结构的系统排列。 谷歌、Facebook 和其他公司多年来一直在使用这种阵列来帮助他们的软件识别图像中的人物。 一种更新的方法涉及所谓的生成对抗网络(GAN),它由一个创建图像的“生成器”网络和一个评估其真实性的“判别器”网络组成。

西雅图艾伦人工智能研究所首席执行官奥伦·埃齐奥尼表示:“神经网络渴望从数百万个示例图像中学习。 GAN 是一种[相对]较新的自动生成此类示例的方法。”


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。 通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


然而,GAN 也可以使人工智能快速生成逼真的虚假图像。 生成器网络使用机器学习来研究大量的图片,这实际上教会了它如何制作具有欺骗性的逼真图片。 它将这些图片发送到判别器网络,该网络经过训练以确定真实人物的图像是什么样的。 判别器根据生成器图像的逼真程度对其进行评分。 随着时间的推移,生成器越来越擅长生成虚假图像,而判别器也越来越擅长检测它们——因此得名“对抗性”。

GAN 被誉为人工智能领域的突破,因为在最初的训练之后,它们可以在无人监督的情况下继续学习。 Ian Goodfellow 是 Google Brain(该公司的人工智能项目)的研究科学家,他是 2014 年一项引入这种方法的研究的主要作者。 此后,全球数十名研究人员尝试将 GAN 用于各种用途,例如机器人控制和语言翻译。

开发这些无人监督的系统是一项挑战。 GAN 有时会随着时间的推移而无法改进; 如果生成器无法生成越来越逼真的图像,那么判别器也无法变得更好。

芯片制造商英伟达开发了一种训练对抗网络的方法,该方法有助于避免这种停滞不前的发展。 关键是逐步训练生成器和判别器——首先输入低分辨率图像,然后在训练过程中添加引入更高分辨率细节的新像素层。 英伟达研究人员计划在今年春季的国际人工智能会议上发表的一篇论文称,这种渐进式机器学习策略还将训练时间缩短了一半。 该团队通过使用包含 20 多万张名人图像的数据库来训练其 GAN,从而证明了其方法,然后 GAN 生成了不存在的人的逼真、高分辨率面孔。

机器本身并不知道它创建的图像是否逼真。 英伟达参与该项目的研究员 Jaakko Lehtinen 说:“我们选择面孔作为我们的主要示例,因为我们人类很容易判断生成式人工智能模型的成功与否——我们都有内置的神经机制,并且在我们的生活中不断训练,用于识别和解释面孔。” 挑战在于让 GAN 模仿人类的那些本能。

Facebook 将对抗网络视为帮助其社交媒体平台更好地预测用户希望根据他们之前的行为看到什么,并最终创建表现出常识的人工智能的一种方式。 该公司的人工智能研究主管 Yann LeCun 和研究工程师 Soumith Chintala 将他们理想的系统描述为“不仅能够进行文本和图像识别,而且还能够进行推理、预测和计划等更高阶的功能,与人类的思维和行为方式相媲美。” LeCun 和 Chintala 通过向生成器输入四个视频帧并让其使用人工智能生成接下来的两个帧来测试其生成器的预测能力。 结果是动作的合成延续——无论是人只是走路还是头部运动。

高度逼真的人工智能生成图像和视频为需要相对廉价内容的电影制作人和视频游戏创作者带来了巨大的希望。 但是,人工智能研究公司 OpenAI 的研究员兼一项研究(在 2016 年国际人工智能会议上发表)的主要作者 Alec Radford 说,尽管 GAN 可以生成“乍一看看起来很逼真”的图像,但它们在实现真正的照片级真实感之前还有很长的路要走,Facebook 的工作就是基于这项研究。 Radford 补充说,高质量的人工智能生成视频甚至还遥遥无期。

在线恶作剧者(已经制作虚假病毒式内容)是否会出于不正当目的使用人工智能生成的图像或视频,这仍有待观察。 在人们越来越质疑他们在网上看到的内容的真实性之际,这项技术可能会播下更大的不确定性。

© . All rights reserved.