3月,索尼世界摄影奖公布了其创意摄影类别的获奖作品:一张黑白照片,描绘了一位年长的女性拥抱一位年轻的女性,题为《伪失忆症:电工》。宣布获奖的新闻稿将这张照片描述为“令人难忘”且“让人联想到20世纪40年代家庭肖像的视觉语言”。
但这位艺术家,柏林人鲍里斯·埃尔达格森,拒绝了该奖项。他宣布,他的照片根本不是照片:而是通过对DALL-E 2(一种人工智能图像生成器)的创意提示制作而成。
埃尔达格森在他的网站上解释说:“我像一只厚脸皮的猴子一样申请,是为了 выяснить 比赛是否为人工智能图像的参赛做好了准备。他们没有做好准备。”他的这一举动引发了关于何时应将人工智能生成或辅助图像视为艺术的争议和讨论。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们今天世界的发现和思想的具有影响力的故事的未来。
《大众科学》与埃尔达格森谈论了该图像的创作以及人工智能辅助“提示摄影”的未来。
[以下是采访的编辑稿。]
您是如何开始接触人工智能艺术的?
我最初接触摄影是因为绘画是一项孤独的工作。我一直在尝试。所以当人工智能生成器出现时,我从一开始就被迷住了。对我来说,作为一名艺术家,人工智能生成器是绝对的自由。它就像我一直想要的工具。作为一名摄影师,我一直从我的想象力出发进行创作,而现在我使用的材料是知识。如果你年纪大了,这是一个优势,因为你可以将你所有的知识投入到提示和创作图像中。如果我只有15岁,我可能只会生成蝙蝠侠。
《电工》的灵感来自哪里?
我做这件事是为了自己练习,我只是喜欢这个结果。它源于几年前开始的一个项目。我的父亲出生于1924年。所以他在17岁时参战,但像德国那一时代的大多数人一样,从未谈论过这件事。在他去世后,我发现了一些我母亲和我以前从未见过的四十年代的照片。仅仅通过观看这些照片,我就了解了很多关于他们那个时代的事情,我开始在跳蚤市场和eBay上收集四十年代的照片,但不知道该如何处理它们。
所以我的第一个实验是:我可以用人工智能重新创作那个时代的图像吗?然后“电工”就诞生了。最好的图像是那些你以前没有想到的图像。它们是在过程中产生的。你开始,它会引导你到某个地方——人工智能也是如此。你从某个地方开始,然后你做出许多不同的决定。你删除元素,你添加框架。有时人工智能有非常好的建议。有时它只是垃圾。这需要时间和耐心,所以它不是在20秒内完成的。可能需要几天时间。
那么您实际上是如何制作这张图像的?
我使用了DALL-E 2,所有这些都是通过文本提示以及图像修补和外绘完成的。对于图像修补,你可以说,“我不喜欢他的领带”,然后你擦掉它并写道,“我希望他戴一条白色领带。”然后你会得到建议。如果你不喜欢任何这些建议,你就重新开始。外绘是当框架不够大时你所做的事情。你放入一个额外的框架,这样你就可以看到他的整个领带、他的裤子、椅子、地板。它是无止境的。
您为什么决定将它提交给摄影比赛?
我一直非常关注人工智能和摄影——我已经成为德国的专家之一——所以这不仅仅是我在开玩笑。我想测试一下比赛是否考虑到可以提交人工智能生成的图像。我申请了三个不同的比赛,这张图像总是入围决赛。这张图像有一些特别之处。当我申请时,我没有说是人工智能生成的。我将信息保持得很简短:只有图像和标题。然后当它被选中时,我说这件艺术品是人工智能生成的。
我所希望发生的事情已经发生了:对话已经开始,基本上是在社区的帮助下。我没有想到它会如此盛大;我以为这只会在欧洲摄影界持续一周的对话。
您认为有人可以通过观看图像就判断出它是人工智能生成的吗?
当然可以。外绘会产生颜色差异。左侧太黄,右侧变成黑白。然后可能是手指,但右侧手臂的一部分,你可以看出来。如果你像我一样每天使用它,你可以看出来。
您曾经被人工智能图像愚弄过吗?
有一本德国杂志叫《GEO》;它有点像德国的《国家地理》。他们进行了一项在线测试,展示图像,询问“是生成的还是真实的?”我失败了一次。
我认为对于《电工》来说, 很容易判断出来,因为它是一张去年九月初的旧图像。但我认为到今年年底,我们将无法分辨。
这让您感到担忧吗?
作为一名艺术家,我只是喜欢它。但作为一名公民,我深感担忧。大多数类型的摄影都可以通过人工智能来增强,但新闻摄影部分除外。媒体需要提出一个系统,明确什么是真实的、被操纵的或生成的。教皇巴伦西亚加人工智能生成的照片应该始终被注明。如果你不这样做,民主将被任何会写五个字的人操纵和误导。
但是事实核查是一项繁重的工作。这需要时间。因此,为了让媒体做到这一点,支付所有员工的工资,并且还要拥有人工智能技术来帮助——谁来为此买单?现在作为公民,我说,我们不能让媒体单独工作。对于一个民主社会来说,[能够区分真照片和假照片]非常重要。因此,我们必须考虑共同资助[事实核查]的结构,作为公民,作为一个民主国家。但是,我们如何才能共同资助它,同时又能保持新闻自由?这是我们需要思考的问题。
那么,抛开民主和新闻业的未来不谈——人工智能将如何在艺术界立足?
我提出的一个建议是清理术语,不要再将逼真的人工智能艺术称为“人工智能摄影”,因为它不是摄影。社区提出的一个建议是“提示摄影”,我非常喜欢这个词。它足够广泛,可以涵盖结果看起来像绘画、像油画、像照片。
下一步将是讨论提示摄影和摄影之间的关系。它们是否属于同一个篮子——同一个博物馆、节日、画廊、比赛?这非常复杂。我对此没有任何答案。我唯一能说的是,双方的简单答案——那些想要回到模拟时代的人和那些说提示摄影就是摄影的人——都是无稽之谈。我们需要比这更深入地思考。