人工智能分析执法记录仪视频为警察改革提供数据驱动的方法

大规模检查执法记录仪视频揭示了警察在交通拦截期间对待不同种族驾驶员的差异——以及哪些纠正计划真正有效

Close up of a police officer in Santa Fe, New Mexico, wearing a body-worn camera made by Digital-Ally

新墨西哥州圣塔菲的一名警察佩戴着执法记录仪。

Shiiko Alexander/Alamy Stock Photo

十年前,时任总统巴拉克·奥巴马提议在三年内拨款 7500 万美元,帮助各州购买警察执法记录仪以扩大其使用范围。 此举是在青少年迈克尔·布朗被杀事件之后提出的,当时没有执法记录仪录像,其目的是提高透明度,并在警察和他们服务的人民之间建立信任。

自 2015 年首次拨款以来,数千万次的交通拦截和事故、街头拦截、逮捕等事件都通过这些小型数字设备记录了下来,警察将这些设备安装在制服或冬季外套上。 录像被认为可作为争议事件的证据,例如 2020 年明尼阿波利斯市乔治·弗洛伊德死亡事件。 摄像头的使用也可能阻止警察在与公众互动时的不良行为

但是,除非发生悲剧,否则执法记录仪录像通常无人观看。 南加州大学政治学家本杰明·格雷厄姆说:“我们花费大量资金收集和存储这些数据,但几乎从未使用于任何事情。”


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。 通过购买订阅,您正在帮助确保未来能够继续发布关于塑造我们当今世界的发现和想法的具有影响力的故事。


格雷厄姆是少数几位重新构想这些录像为数据而不仅仅是证据的科学家之一。 他们的工作利用了自然语言处理的进步,自然语言处理依赖于人工智能,以自动化分析公民与警察互动视频的文字记录。 这些发现使警察部门能够发现警务问题,找到解决问题的方法,并确定这些修正是否能改善行为。

到目前为止,只有少数警察机构向研究人员开放了他们的数据库。 但斯坦福大学心理学家詹妮弗·埃伯哈特说,如果定期分析这些录像,这将是“真正的游戏规则改变者”,她率先开展了这一研究方向。 “我们可以逐节、逐刻地看到互动是如何展开的。”

在过去七年发表的论文中,埃伯哈特和她的同事们检查了执法记录仪录像,揭示了警察如何以不同的方式与白人和黑人交谈,以及哪种类型的谈话可能赢得一个人的信任或预示着不良结果,例如戴手铐或逮捕。 这些发现改进和加强了警察培训。 在 9 月份发表在PNAS Nexus上的一项研究中,研究人员表明,新的培训改变了警官的行为

加利福尼亚州奥克兰警察局前局长勒罗恩·阿姆斯特朗说:“通过进行这些类型的研究并在您的部门中进行改进,它实际上有助于在信任度非常低的社区中建立信任。”奥克兰警察局与斯坦福团队有着长期的合作关系。

这种方法正在慢慢流行起来。 受斯坦福大学研究结果的启发,监督洛杉矶警察局 (LAPD) 的洛杉矶警察委员会要求南加州大学帮助理解该部门的录像。 一个分析 30,000 个执法记录仪视频的项目正在进行中,这些视频涵盖了一年的交通拦截。 斯坦福大学的研究小组还与旧金山警察局合作,利用执法记录仪录像来评估一项计划,该计划让旧金山警察前往阿拉巴马州伯明翰,了解民权运动和非暴力原则。

斯坦福大学的工作始于 2014 年奥克兰警察局发生丑闻之后。 四名被称为“骑警”的加利福尼亚州奥克兰市警察被指控殴打和逮捕无辜者,并在他们身上栽赃毒品,以及其他罪行,这些罪行可以追溯到 1990 年代后期。 在 119 名原告中,有 118 名是黑人。 因此,作为 1090 万美元和解协议的一部分,该部门被要求收集有关车辆和行人拦截的数据,并按种族进行分析。 在协议达成十多年后,该部门的联邦监督员联系了埃伯哈特寻求帮助。

原告律师告诉埃伯哈特,他们最想知道的是警车警灯亮起后发生了什么——警察为什么要拦截人们,以及互动是如何进行的。 该部门是执法记录仪的早期采用者,大约在五年前就投入使用了。 “你们实际上有录像,”埃伯哈特回忆起她当时告诉他们的话,尽管该部门没有人想到将其用于该目的。

埃伯哈特招募了斯坦福大学语言学家兼计算机科学家丹·朱拉夫斯基和他当时的学生罗布·沃伊特(现为西北大学计算语言学家)开发一种自动化方法来分析近 1000 次交通拦截的视频文字记录。 研究人员决定衡量警察对黑人驾驶员的尊重程度是否低于对白人驾驶员的尊重程度。 他们首先让人们对文字记录摘录的尊重程度进行评分。 然后,他们建立了一个计算模型,将评分与各种词语或短语联系起来,并为这些话语赋予数值权重。 例如,表达对驾驶员的关心被评为高度尊重,而直呼其名则不太尊重。

然后,该模型对一个月交通拦截中所有警察语言给出了尊重评分,研究人员将这些评分与被拦截者的种族以及其他变量联系起来。 他们发现警察语言的尊重程度存在明显的种族差异。 例如,在与黑人驾驶员交谈时,警察不太可能说明拦截原因、提供保证或表达对驾驶员安全的担忧。 尊重差距存在于整个互动过程中,并且不取决于警察的种族、拦截原因或其地点或结果。

这些最初的结果于 2017 年发布,在奥克兰产生了深远的影响。 阿姆斯特朗说:“当斯坦福大学发布研究结果时,少数族裔社区几乎如释重负。 “这验证了人们一直以来的担忧,并促使该部门重新审视我们如何培训警官与社区沟通。”

斯坦福大学的研究小组利用这些发现,为该部门提供的程序公正培训计划开发了一个“尊重”模块。 程序公正旨在将公平性融入警务程序。 除了强调尊重之外,它还可能包括警察向他人解释他们的行为,并给这些人提供表达他们观点的机会。 作为这项工作的一部分,该团队使用其计算模型提取了特别尊重和不尊重的真实互动。 朱拉夫斯基说:“作为培训示例,这似乎比虚构的场景对接受培训的人来说更合法。 “[警官] 认识到他们自己的语言。”

在培训生效后,研究人员进行了另一项执法记录仪研究,以确定警官是否使用了他们所学到的知识。 斯坦福大学的研究小组比较了培训前最多四周内发生的 313 次拦截中警官语言的关键特征与培训后四周内发生的 302 次拦截中警官语言的关键特征。 研究人员在 9 月份的PNAS Nexus研究中报告说,他们发现接受过培训的警官更有可能表达对驾驶员安全的担忧、提供保证并明确说明拦截原因

埃伯哈特说,系统地分析执法记录仪录像为理解哪些类型的警察培训有效提供了一种有希望的方法。 “他们现在进行的许多培训都没有经过严格的评估,”她说。 “我们不知道他们在这些培训中学到的东西……是否真的转化为与街上真实的人的真实互动。”

在去年发表的一项研究中,斯坦福大学的研究人员分析了执法记录仪录像,以找到与交通拦截的“升级结果”相关的语言,例如戴手铐、搜查或逮捕。 他们使用来自一个未公开城市 577 次黑人驾驶员拦截的录像,发现了埃伯哈特所说的警官在最初 45 个词语中“升级的语言特征”:从一开始就向驾驶员下达命令,而不说明拦截原因。 她说:“这两者的结合是一个很好的信号,表明拦截最终会导致驾驶员被戴上手铐、搜查或逮捕。”

研究中的所有拦截都没有涉及武力使用。 但研究人员好奇他们发现的特征是否会出现在导致弗洛伊德死亡的警察互动录像中。 结果是肯定的。 在遭遇事件的最初 27 秒(大约是警察在拦截期间说出 45 个词语所需的时间),警察下达了命令,没有告诉弗洛伊德他被拦截的原因。

南加州大学的研究小组招募了一群不同背景的人,包括一些以前被监禁的人和退休警察,来判断洛杉矶警察局执法记录仪拍摄的互动是否礼貌、尊重以及程序公正的其他方面。 该团队计划利用人工智能的进步来捕捉这些视角,这些视角可能会揭示,例如,为什么一句本意是幽默或谦恭的话语可能会被认为是讽刺或不尊重的。 南加州大学认知科学家莫尔特扎·德赫加尼说:“最大的希望是我们的工作可以改进洛杉矶警察局的警官培训,拥有一种数据驱动的方式来更新和改变培训程序,使其更好地适应他们所服务的人群。”他与格雷厄姆共同领导该项目。

政治可能会劝阻警察部门与学者分享录像。 在某些情况下,部门可能不愿意揭露系统性问题。 然而,未来,各部门可能能够自行分析录像。 一些私营公司——例如TRULEOPolis Solutions——已经为此目的提供了软件。

密歇根大学社会心理学家尼古拉斯·坎普说:“我们越来越接近各部门能够使用这些工具,而不仅仅是将其作为一种学术练习。”他曾在埃伯哈特的团队工作过。 但商业模型往往不完全透明——用户无法检查其组件模块——因此包括坎普和德赫加尼在内的一些学者对它们的输出持谨慎态度。

南加州大学的研究小组计划将其构建的语言模型(将公开接受检查)提供给洛杉矶警察局和其他警察部门,以便他们可以例行监控警官与公众的互动。 格雷厄姆说:“我们应该掌握更多关于这些日常互动如何进行的详细信息。 这是民主治理的重要组成部分。”

© . All rights reserved.