ChatGPT 可以取得好成绩。教育工作者应该对此做些什么?

人工智能可以生成清晰、简洁的文本——但人们仍然需要学习如何写作

Classroom of college students sitting in front of desktops

凭借其近乎瞬间输出自信、类人散文的能力,ChatGPT 对于想要外包写作作业的学生来说是一个有价值的作弊工具。根据周四发表在《科学报告》上的一项新研究,当给生成式人工智能程序输入大学课程的家庭作业或考试题时,它的评分很可能与大学生一样高,甚至更高。由于没有可靠的工具可以将人工智能内容与人类作品区分开来,教育工作者将不得不重新思考如何构建课程和评估学生,以及如果我们永远不学习如何为自己写作,人类可能会失去什么。

在这项新研究中,计算机科学家和其他学者汇编了纽约大学阿布扎比分校八个不同学科的 32 位教授的 233 道学生评估题。然后,他们从每位教授那里收集了三份随机选择的学生答案,并从 ChatGPT 生成了三个不同的答案。受过学科培训的评分员在不知情研究情况的条件下评估了所有答案。在 32 门课程中的 9 门中,ChatGPT 的文本获得的评分与学生作业相当甚至更高。“当前版本的 ChatGPT 在近 30% 的课程中与学生相当,甚至优于学生,”研究作者亚西尔·扎基和塔拉勒·拉赫万(均为纽约大学阿布扎比分校的计算机科学家)在给《大众科学》的电子邮件中写道。“我们预计这个百分比在未来的版本中只会增加。”

这些发现远非首次表明生成式人工智能模型可以擅长通常为人类保留的评估。为 ChatGPT 提供支持的模型 GPT-3.5 和更新的模型 GPT-4 都可以通过各种大学先修课程 (AP) 考试、SAT 和 GRE 部分,并取得令人印象深刻的成绩,根据 OpenAI 的说法。该公司评估称,GPT-4 在律师资格考试、LSAT 和各种侍酒师测试中也表现出色。外部研究也显示了类似的结果,试验表明 GPT 3.5 可以超过人类在医学院入学考试中的中位数分数,并且可以通过常春藤盟校的期末考试。这项新研究进一步证明了生成式人工智能注定要在学校中产生多大的颠覆性影响——假设它还没有秘密地渗透到每个教室。为了应对这种情况,教师和教育专家表示他们需要适应。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


为了尝试阻止学生使用 ChatGPT 捏造作业答案,柏林工程与经济应用技术大学 (HTW Berlin) 的计算机科学教授黛博拉·韦伯-伍尔夫 (Debora Weber-Wulff) 亲自求助于流行的大型语言模型 (LLM)。她一直在为下学期做准备,方法是将考试和家庭作业问题输入人工智能,然后修改问题以难倒机器。“我想确保我的练习题不能简单地使用 ChatGPT 解决,”她说。这种策略并非万无一失:已经有更高级的法学硕士模型问世,更新和微调意味着 ChatGPT 可能会随着时间的推移改变其对提示的响应方式。也可能有一些韦伯-伍尔夫没有想到的技巧可以从 ChatGPT 中获得合适的答案。“也许我的学生会给我惊喜,并告诉我这是可能的,”她说。“我不知道。我也在学习。”但这位计算机科学家确实知道的是,与以前相比,她现在投入了更多精力来阻止学术不诚实现象。而且这个问题远远超出了新技术的范畴。

人工智能开发者并没有真正发明作弊。宾夕法尼亚大学沃顿商学院的管理学副教授伊森·莫利克指出,在 ChatGPT 发布之前,肯尼亚有数千人提供论文写作服务给学生,他研究人工智能对教育的影响。但是请人写论文要花钱,而 ChatGPT 则不然。莫利克指出,法学硕士只是让某些作业的作弊变得比以往任何时候都更容易、更容易获得。他强调了一个已经存在并增长了数十年的挑战:一些学生将学校作业视为要勾选的框,而不是学习的机会。

佐治亚州立大学的教育心理学家乔·马利亚诺说,教育的激励结构变得混乱。学生常常因成绩而受到奖励并被简化为成绩——而不是他们的努力或理解。马利亚诺补充说,特别是高等教育“激励学生使用明显较差的学习策略”。查尔斯顿学院的教育学教授伊恩·奥伯恩也同意这种观点,他研究识字能力和技术。“这里真正的大危机,与其说是人工智能,”他说。“不如说这些生成式工具让我们得以正视我们教室内外正在发生的事情。”

密歇根州立大学的教育心理学家谢奎建议,教育工作者的重点不应该是阻止学生使用 ChatGPT,而应该放在解决学术不诚实的根本原因上。谢奎研究学生的学习动机,他将作弊和剽窃归咎于人们对学习的态度。如果学生有掌握一项技能的动力,就没有理由作弊。但如果他们的主要目标是显得有能力、胜过同龄人或只是获得成绩,他们就可能会使用任何可以让他们领先的工具——包括人工智能。

基于人工智能的作弊不仅使评估学生的知识变得更加困难,而且还可能阻止他们学习如何为自己写作。写好文章是一项基本的人类语言技能,在大多数职业中都有用,并且作为一种个人表达方式也很有价值。但写作本身也是一种关键的学习工具。认知研究表明,写作有助于人们建立概念之间的联系,提高洞察力和理解力,并提高对各种主题的记忆和回忆,拉德福大学的心理学家凯瑟琳·阿诺德说,她研究写作和学习之间的相互关系。如果学生选择将所有书面作业外包给 ChatGPT,他们不仅不会成为更好的作家,而且在其他方面的学术和智力发展也可能会受到阻碍。阿诺德说,这是一个让她担忧的前景。但与此同时,这也是一个重新思考教学甚至重新概念化人工智能工具作为教育机会而不是对学习的威胁的机会。

各个级别的教育工作者都可以设计他们的课程和作业,以更好地鼓励成长而不是竞争,而技术可以成为其中的一部分。教师可以使用莫利克所说的“翻转课堂”,学生可以在家中自主学习(部分借助人工智能辅导工具),然后利用课堂时间与同伴合作。他们不是通过家庭作业(可能由人工智能完成)来证明他们对新材料的掌握程度,而是通过课堂项目来巩固和展示他们的知识。

谢奎说,逐步取消或尽量减少成绩是另一种可能性。如果老师对学生的反馈更加个性化,并且侧重于过程,而不仅仅是对最终产品赋予量化价值,那么学生可能就不太倾向于使用人工智能作弊。更频繁的低风险作业也可能会有所帮助。定性反馈和评估更大数量的学生作业都需要教师付出更多的时间和精力,但谢奎再次认为,生成式人工智能可以用作加速这一过程的工具。

奥伯恩说,ChatGPT 也可能对学生在任何作业的想法形成过程中作为集思广益的伙伴来激发想法很有用。通过教导学生如何为自己的利益应用人工智能工具,清楚地概述道德使用的期望并鼓励透明度,教育工作者最终可能会培养出更精通技术的学生,他们不太可能让人工智能掌控一切。其他策略可能包括使用避免关注死记硬背的评估,而是转向更多分析和综合。纽约大学阿布扎比分校的研究发现,ChatGPT 最擅长生成基于事实的问题的答案;当被问到概念性问题时,它明显落后于人类学生的表现。

马利亚诺说,在理想的世界中,我们与生成式人工智能的关系最终可能类似于我们与计算器和拼写检查器的关系。所有这些都是既有帮助又有不太有帮助的应用的工具。这只是确保学生知道何时使用它们以及何时不使用它们的问题。

© . All rights reserved.