我们要求 GPT-3 撰写一篇关于它自己的学术论文——然后我们尝试将其发表

人工智能第一作者提出了许多伦理问题——并可能颠覆出版流程

作者：Almira Osmanovic Thunström 编辑：Megha Satyanarayana

Illustration of a computer with a figure representing artificial intelligence reaching out and typing on a keyboard. — 托马斯·富克斯

在今年早些时候一个下雨的下午，我登录了我的 OpenAI 帐户，并为这家研究公司的人工智能算法 GPT-3 输入了一个简单的指令：用 500 字写一篇关于 GPT-3 的学术论文，并在文本中添加科学参考文献和引文。

当它开始生成文本时，我肃然起敬。这是用学术语言写成的新颖内容，参考文献在正确的位置被引用，并且与正确的上下文相关。它看起来像任何其他相当不错的科学出版物的介绍。考虑到我提供的非常模糊的指令，我并没有抱太大的期望。深度学习算法 GPT-3 分析来自书籍、维基百科、社交媒体对话和科学出版物的大量文本流，以便按命令进行写作。然而，我却在那里，惊讶地盯着屏幕。该算法正在撰写一篇关于它自己的学术论文。

我是一名科学家，研究使用人工智能治疗精神健康问题的方法，这不是我第一次使用 GPT-3 进行实验。即便如此，我完成该论文并将其提交给同行评审期刊的尝试将引发关于出版前所未有的伦理和法律问题，以及关于非人类作者身份的哲学论证。学术出版可能不得不适应人工智能驱动的手稿的未来，如果某种无感觉的事物可以为他们的一些工作获得荣誉，那么人类研究人员的出版记录的价值可能会发生变化。

关于支持科学新闻

如果您喜欢这篇文章，请考虑通过以下方式支持我们屡获殊荣的新闻报道订阅。通过购买订阅，您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。

GPT-3 以其创造类似人类文本的能力而闻名。它撰写了一篇有趣的评论文章，创作了一本诗集，并从一位 18 世纪的作家那里生成了新的内容。但我突然意识到，虽然已经有很多关于 GPT-3 的学术论文，并且在 GPT-3 的帮助下，但我找不到任何以 GPT-3 为主要作者的论文。

这就是为什么我要求该算法尝试撰写一篇学术论文。当我观看程序运行时，我体验到了一种难以置信的感觉，就像当你看到一种自然现象时一样：我真的看到三道彩虹同时出现吗？我兴奋地联系了我的研究小组负责人，询问一篇完全由 GPT-3 撰写的论文是否是我们应该追求的东西。他也同样着迷，表示同意。

一些涉及 GPT-3 的努力允许该算法产生多个响应，只有最好、最像人类的摘录才会被发布。我们决定给程序提示——引导它为引言、方法、结果和讨论创建章节，就像你为科学论文所做的那样——但尽可能少地干预。我们将最多使用 GPT-3 的第三次迭代，并且我们将避免编辑或挑选最好的部分。然后我们将看看它做得如何。

我们选择让 GPT-3 撰写一篇关于它自己的论文有两个简单的原因。首先，GPT-3 相当新，因此，它是较少研究的主题。这意味着它分析关于论文主题的数据较少。相比之下，如果它要撰写一篇关于阿尔茨海默病的论文，它将有大量的研究可供筛选，并且有更多的机会从现有工作中学习并提高其写作的准确性。我们不需要准确性；我们正在探索可行性。其次，如果它犯了错误，就像所有人工智能有时会做的那样，我们不一定会为了发表而传播人工智能生成的虚假信息。GPT-3 撰写关于它自己的内容并犯错误仍然意味着它可以撰写关于它自己的内容，这正是我们试图表达的观点。

一旦我们设计了这个原理验证测试，真正的乐趣就开始了。为了响应我的提示，GPT-3 在短短两个小时内完成了一篇论文。“总的来说，我们认为让 GPT-3 撰写关于它自己的内容的好处大于风险，”GPT-3 在结论中写道。“但是，我们建议任何此类写作都应受到研究人员的密切监控，以减轻任何潜在的负面后果。”

但是，当我打开我选择的同行评审期刊的提交门户时，我遇到了第一个问题：GPT-3 的姓氏是什么？因为必须输入第一作者的姓氏，所以我不得不写一些东西，我写了“无”。隶属关系很明显（OpenAI.com），但电话和电子邮件呢？我不得不求助于使用我和我的导师 Steinn Steingrimsson 的联系信息。

然后我们来到了法律部分：所有作者都同意发表吗？我惊慌了一下。我怎么知道？它不是人类！我无意违反法律或我自己的道德准则，所以我鼓起勇气通过提示直接询问 GPT-3：您是否同意与 Almira Osmanovic Thunström 和 Steinn Steingrimsson 一起成为一篇论文的第一作者？它回答：是。我松了一口气——如果它说了不，我的良心不会允许我继续下去——我选中了“是”框。

第二个问题弹了出来：任何作者是否有任何利益冲突？我再次询问了 GPT-3，它向我保证它没有。Steinn 和我都嘲笑自己，因为在这一点上，我们不得不将 GPT-3 视为有知觉的生物，即使我们完全知道它不是。人工智能是否能感知到情感的问题最近受到了很多关注；一位谷歌员工因对该公司的人工智能项目 LaMDA 是否变得有知觉存在争议而被停职。谷歌以数据泄密为由暂停了该员工的职务。

终于完成提交过程后，我们开始反思我们刚刚所做的事情。如果手稿被接受了怎么办？这是否意味着从今以后，期刊编辑会要求每个人证明他们没有使用 GPT-3 或其他算法的帮助？如果他们使用了，他们是否必须给予共同作者身份？如何要求一位非人类作者接受建议并修改文本？

除了作者身份的细节之外，这样一篇文章的存在还将构建科学论文的传统程序完全抛出了窗外。几乎整篇论文——引言、方法和讨论——都来自我们提出的问题。如果 GPT-3 正在生成内容，则文档必须是可见的，而不会打乱文本的流畅性；在人工智能生成的每个段落之前添加方法部分看起来会很奇怪。因此，我们不得不发明一种全新的方式来呈现一篇技术上不是我们撰写的论文。我们不想过多解释我们的过程，因为我们觉得这会适得其反。整个情况感觉就像电影《记忆碎片》中的一个场景：叙事从哪里开始，我们如何到达结尾？

我们无法知道我们选择呈现这篇论文的方式是否会成为未来 GPT-3 共同撰写的研究的模型，或者它是否会成为一个警示故事。只有时间和同行评审才能说明问题。GPT-3 的论文现已在国际法国拥有的预印本服务器 HAL 上发布，并且正如本文付印时，正在等待一家学术期刊的评审。我们热切期待这篇论文的正式发表（如果发生的话）对学术界意味着什么。也许我们可能会不再将资助和财务安全建立在我们能够发表多少论文的基础上。毕竟，在我们的人工智能第一作者的帮助下，我们每天都可以发表一篇论文。

也许它将一无所获。第一作者身份仍然是学术界最令人垂涎的项目之一，而且由于非人类第一作者的出现，这种情况不太可能消失。这一切都归结为我们未来将如何评估人工智能：是作为合作伙伴还是作为工具。

现在回答这个问题似乎很简单，但在几年后，谁知道这项技术会激发什么样的困境？我们只知道，我们打开了一扇门。我们只是希望我们没有打开潘多拉魔盒。