巡警约瑟夫·坎宁安和我正在搜捕罪犯。不是普通的骗子,而是入室盗窃犯。而且不仅仅是在任何地方:虽然孟菲斯市覆盖 315 平方英里,但我们的搜索区域已缩小到城镇中犯罪猖獗地区仅有的几个街区的低矮砖砌公寓楼。搜索的日期和时间也已严格限定——星期四,下午 4 点到晚上 10 点之间。轮班现在开始。“我不指望今晚会有任何汽车追逐,但如果发生追逐,请务必系好安全带,”坎宁安在我们驶出车站时说道。
在 6540 号警车中,坎宁安和我到达了他的报告标记的区域。我们正在搜寻潜在的入室盗窃犯——“我正在寻找看起来无处可去的人,”坎宁安解释道——以及一个特别的嫌疑人:一个名叫德文的男子,他可能是一连串该地区入室盗窃案的幕后黑手。坎宁安在仪表板上的触摸屏上调出了德文的照片。
我们慢慢地驶入其中一栋楼的停车场。一个路过的男人抬起头,注意到我们,然后匆匆躲进了一个内部庭院。坎宁安猛踩油门,我们绕着综合楼的三面飞驰,尖叫着刹车,及时拦截了从另一边走出来的那个男人。坎宁安跳下车,跑到那个男人面前。“等一下,”他说。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和思想的具有影响力的故事的未来。
任何优秀的警察都知道他辖区的“聚宝盆”,即犯罪最常见且最容易逮捕的地方。但坎宁安的街头智慧今晚得到了社会学家、调查员、数学家和一个装满计算机的房间做出的犯罪预测的帮助。孟菲斯警察局 (MPD) 和孟菲斯大学之间的合作被称为 Blue CRUSH(犯罪削减利用统计历史),这项行动被认为有助于将全市重大财产和暴力犯罪数量自 2006 年启动以来减少了 26%。汽车盗窃、抢劫和谋杀案骤降了 40%。
数字运算在警察工作中并不新鲜——纽约市警察局广受模仿的 CompStat 计划就是例证,该计划在 20 世纪 90 年代中期推出时,为官员提供了频繁更新的高犯罪率地区地图。但在过去的几年里,所谓的预测性警务变得越来越复杂。最雄心勃勃的犯罪学家不再满足于分析过去的数据——他们正在尝试预测未来。
预测性警务是当今执法部门最热门的话题之一,美国和欧洲正在进行十多项实验性努力。然而,这种未来主义方法的肮脏秘密是,没有人能确定它是否有效。犯罪的原因是多因素且复杂的,因此很难确定哪种策略最适合打击犯罪。犯罪学家才刚刚开始将预测性警务工作的影响与其他降低犯罪的无数因素(例如美国人口老龄化)区分开来。所有专家确定知道的是,警察正在做一些正确的事情。在美国各地,犯罪率已降至四十年来最低水平。
当坎宁安带着那个人的驾驶执照返回时,照片看起来与触摸屏上的德文的照片几乎一模一样。但他的名字不符——这是认错人了——所以坎宁安再次下车,让那个人离开。“他今天真幸运,”他说。
犯罪现场
预测性警务听起来像是作家菲利普·K·迪克想象的可怕未来,确实,他 1956 年的短篇小说《少数派报告》(后来被改编成史蒂文·斯皮尔伯格的电影)描述了一个未来,警察部门在罪犯实施犯罪之前就拦截了他们。在现实生活中,这种方法依赖于犯罪分析师和计算机软件,而不是坐在黑暗房间里的变种人的幻象。它也不会告诉你谁可能犯罪。相反,它会为其他一切产生最佳猜测:什么类型的犯罪以及何时何地会发生。“有些人说你无法预测未来会发生什么,”MPD 犯罪分析经理约翰·威廉姆斯说。“好吧,我们说,‘是的,你可以。’”
尽管有反乌托邦的色彩,但这种做法仅仅是预测分析领域的一个引人注目的例子,与艾森豪威尔时代设想的喷气背包和火箭汽车不同,它在今天很常见。
当亚马逊使用口味猜测算法推荐书籍时,这就是预测分析。信用卡公司使用占卜计算机程序来标记不安分的客户,并在他们跳槽到另一张卡之前为他们提供更好的利率,而蓝十字希望预测个人保单持有人在未来几年需要哪些医疗服务。
人类传统上依靠专业知识和直觉来预测未来。人们也很擅长这些直觉预测,正如马尔科姆·格拉德威尔在他 2007 年的热门著作《眨眼之间》中所说明的那样。但预测分析的倡导者表示,我们每天通过相机、计算机和智能手机生成的信息量已经变得难以理解地庞大。“商业和政府数据集的衡量单位不再是兆字节或千兆字节,而是太字节甚至拍字节(1,000 太字节),”伊恩·艾尔斯在他 2008 年的颇具影响力的分析著作《超级运算者》中写道。那么,反眨眼之间假说是,我们迷失在信息海洋中,信息量过于庞大,任何人类大脑都无法智能地导航。具有远见的机器应运而生。
在警察工作中,每一次服务电话、交通拦截、人行道采访和逮捕都会产生数据,这些数据以可操作的线索的承诺诱惑着分析师——只要他们能够从堆积如山的信息瓦砾中挖掘出来。调查员历来都是手动读取统计数据的,从文件存储中提取成批的旧记录,或者仅仅凭感觉意识到正在发生一些可疑的事情。CompStat 将定期的、半自动化的数据分析引入警务,但自早期以来发生变化的不仅是被记录的信息量,还有计算机辅助分析的速度。“我们过去每年都会查看我们的犯罪统计数据,然后说,‘哇,看看发生了什么,’”洛杉矶警察局 (LAPD) 分析工作负责人肖恩·马林诺夫斯基队长说。“然后我们开始每月、每周、每天,现在实时查看。”
孟菲斯预测性警务的总部是实时犯罪中心,它以适合打击犯罪者的堡垒的方式,隐藏在市中心一栋朴素的办公楼的四楼。威廉姆斯带我走过十几位分析师,他们坐在体育场式的阶梯座位上,敲击着电脑。投影屏幕显示着城市中布满图标的地图和监控摄像头的实时画面,覆盖了前墙和侧墙。新闻滚动条在一个屏幕的顶部滚动,显示最新的报告犯罪,例如“机动车盗窃,下午 12:30:46”。
在会议室里,威廉姆斯向我介绍了 W. 理查德·贾尼科夫斯基,他是孟菲斯大学的犯罪学家,也是 Blue CRUSH 的最初远见者之一。该项目的种子是在警方寻求他的帮助以应对该市的性侵犯率时播下的,该市二十年来在全国排名第一或第二高。贾尼科夫斯基召集了受害者焦点小组,并亲自走访了袭击地点。但最深刻的见解来自大约 5,000 起强奸案的大量警方报告数据——时间、地点、袭击描述。分析显示,许多受害者在类似情况下遭到袭击:晚上离开家使用安装在便利店外的公用电话时。警方告诉便利店老板将公用电话移到室内,果然,孟菲斯的强奸案数量很快下降。
这本质上是预测性警务 1.0 的一个例子。贾尼科夫斯基及其公司使用分析软件来深入了解最近发生的事情,他们理所当然地认为,类似的犯罪将在不久的将来再次发生。从那时起,预测技术变得更加强大,使警方能够发现隐藏在更大的数据集(多达数十万条记录)中的模式——将信号与周围的噪音分离的过程,这将使典型的调查员不堪重负。
方法论也变得更加复杂。未来并不总是反映过去,因此犯罪学家必须识别个体因素,并梳理出它们单独和组合的影响。加州大学洛杉矶分校的预测性警务专家 P. 杰弗里·布兰廷厄姆解释了根本挑战:“考虑到今天的一系列犯罪,我们能否建立一个数学模型,并说出在概率意义上,明天的犯罪模式可能是什么样子?”他问道。
因此,预测性警务 2.0 看起来像是弗吉尼亚州里士满发生的事情,与孟菲斯的情况一样,里士满也使用 IBM 开发的分析软件。警方计算机按一天中的时间、一周中的天和一个月中的天来分析每起犯罪。犯罪地点按街道地址以及靠近 ATM、公园和酒吧等场所的距离进行解析。计算机配备了当地主要雇主(如菲利普·莫里斯)的工资日以及当地音乐会和体育场馆的日程安排。从枪支展的时间到天气和月相,一切都被认为是潜在重要的。
评估所有这些因素可能如何影响未来的犯罪,需要人与机器之间的伙伴关系,双方各有所长。MPD 中校豪威尔·斯塔恩斯说,计算机更擅长标记统计趋势,但警察仍然必须解释它们。“除非你找到了解他所在辖区的街头警官,否则你不会知道是什么导致了犯罪,”他说。“这就是你必须关注的。不是说你遇到了问题——而是什么导致了这个问题。”
预测性警务的过程通常从警察的直觉开始,例如抢劫案往往会在工资日期间在 ATM 机附近增加。计算机分析可以确定这种直觉是否有效,并为理论增加细微差别。例如,事实证明,特定 ATM 子集周围的抢劫案在工资日增加得最多,因此警察应优先驻扎在那里。在里士满,警方感觉在镇上举办枪支展后,暴力犯罪有所增加。计算机分析证明他们基本上是对的——暴力犯罪风险并非像预期的那样在展会后的周末达到顶峰,而是在两周后达到顶峰。
然而,计算机远远超过了单独工作的人类,因为它们具有惊人的处理能力,并且具有不受人类先入之见蒙蔽的优势。在 2007 年出版的《数据挖掘与预测分析》一书中,作者兼前警察科琳·麦丘描述了弗吉尼亚州的犯罪学家在分析什么类型的人会成为强奸犯时做出的违反直觉的发现。“毫不奇怪,先前犯罪历史可靠地成为最可预测的变量,”麦丘写道。“然而,令人震惊的是,先前的财产犯罪实际上比先前的性犯罪更能预测陌生人强奸犯。”特别是,以前闯入过住宅但几乎没有偷走任何东西的罪犯最有可能在以后强奸。他们可能是在寻找受害者,而不是想偷东西。因此,将来,当计算机标记出一连串没有偷走任何东西的入室盗窃案时,需要提醒居民注意他们中间的强奸犯。
预测软件甚至不需要从人类监督员的理论开始,尽管这可能会有所帮助;计算机可以转而搜索大量数据并自动设计预测算法,这个过程称为规则归纳。将一组数据输入计算机,软件将跟踪导致犯罪的因素组合,从而提示对新组合如何影响整体未来风险进行猜测。例如,当枪支展安排在天气预报预报热浪的同一个周末,或者在即将到来的工资日的晚上将出现满月时,可能会发生什么?
里士满的警察基本上可以将预测想法抛向墙壁,无论多么古怪,看看什么能坚持下来。每次他们引入一个新的候选因素(如家长教师协会学校会议的日程安排)时,他们都会在预测的未来过去后重新评估模型。该模型在预测实际发生的犯罪方面有多好?“最后,该模型可能只利用候选因素的子集,”IBM 软件工程师比尔·哈菲解释说,“但正是这个子集构成了最准确的模型。”
预言家侦探
已故的杰克·梅普尔,当时是纽约市交通警察,在 20 世纪 80 年代通过在地图上用蜡笔和图钉绘制地铁暴力犯罪,启动了现代数据驱动的警务。他称它们为“未来图表”。这是一个朗朗上口的名字,让人联想到迪士尼式的对更美好未来的憧憬,也是一个具有先见之明的名字;今天,近二十年后,地图仍然是预测性警务的关键工具,即使它们反映的分析已经变得更加复杂。
在孟菲斯,我参加了每周一次的 Blue CRUSH TRAC 会议——即跟踪责任、问责制和可信度会议。在一个大型会议室里,该市的八个辖区指挥官轮流登上讲台,讨论他们辖区最新的犯罪情况。他们身后的投影屏幕上显示着标有犯罪象征图标的地图——拳头、破窗户和偷东西的小人——每个图标代表过去一周的单起犯罪事件。
然而,预测性警务方法利用的变量远多于近期犯罪的时间和地点。在孟菲斯,分析师可能会首先调出一张显示近期入室盗窃案的地图。然后,他可以显示学区报告的近期旷课的所有学生的家庭住址。第三层数据将表明哪些逃学学生有过去的入室盗窃罪定罪记录。当一切都吻合时——在有犯罪记录的逃学学生的家附近发生入室盗窃案——就该走上街头,尝试当场抓住小偷了。或者出现在逃学学生的家中。“你去敲门谈话,然后,瞧,你发现偷来的东西堆满了整栋楼,”实时犯罪中心经理约翰·哈维说。
这些算法也开始整合犯罪学家的最新理论。例如,传统观点认为,精明的罪犯不会返回犯罪现场。但加州大学洛杉矶分校的布兰廷厄姆和圣克拉拉大学的数学家乔治·O·莫勒分析了来自洛杉矶警察局的数千份入室盗窃事件和逮捕报告,得出了他们的发现,结果表明,成功的入室盗窃犯确实会这样做。“从罪犯的角度来看,回到你昨天闯入的房子是一个好策略,”布兰廷厄姆说。“你知道房子里有什么。你知道如何快速进出。”更重要的是,他们发现,附近其他房屋的入室盗窃风险也大大增加,因为它们通常具有相似的布局和类型的财产,这使得它们成为有吸引力的目标。
布兰廷厄姆和莫勒此后发现了抢劫、帮派暴力和盗窃汽车的重复受害效应。他们确定了这种效应的延伸范围——在入室盗窃案中约为两英里——以及风险水平在原始犯罪发生后的几天和几周内如何变化。然后,他们开发了包含这些发现的预测算法,创建了一个预测模型,该模型已被证明在预测未来犯罪方面比假设未来将与过去完全相同的经典模型准确度高出 10% 到 20%。
在孟菲斯的 Blue CRUSH TRAC 会议上,每个辖区的地图都标有两个到三个“重点区域”,预计未来一周的犯罪活动将在这些区域最为猖獗。要点列表列出了要警惕的特定犯罪以及时间。这就是巡警坎宁安和我被告知在当天下午 4 点到晚上 10 点之间在格里尔街地区注意入室盗窃犯的原因。
预测还告诉我们,当我们在当晚晚些时候在另一个高风险区域——奥兰治芒德社区巡逻时,我们接到了求助电话。当我们到达时,另外两辆警车,车顶灯旋转着,将一辆黑色尼桑汽车逼到路边。坐在后座的那个男人身上有近两盎司的大麻、几百美元和一个巧妙伪装成 iPhone 的秤。当其中一名警官问他秤是做什么用的时,嫌疑人坦诚地承认自己是毒贩,尽管他对自己的第五修正案权利并不尊重。“有时我的顾客认为我想骗他们,所以我必须称一下产品,”他说。
犯有预谋谋杀罪
毒贩被戴上手铐,安静地坐在车后座。当我们把他送到县监狱时,警察无线电里传来呼叫:“6011 公寓,里奇韦和希科里山。报告有枪击事件。”第二天早上,我在网上阅读了有关该事件的报道。受害者的名字叫克劳德·布雷克,一位 56 岁的退伍军人,现在在棒约翰披萨店工作。他刚送完外卖,两名青少年走近他,索要钱财。他拒绝了。其中一名青少年开枪击中了他。他死了。
即使在孟菲斯这样的大城市,谋杀案也很少发生。该市在 2010 年报告了 25,324 起盗窃案,但只有 90 起谋杀案,这种统计上的罕见性使得不可能生成一种可靠的算法来在杀手行凶前抓住他们。布雷克的谋杀案发生在坎宁安巡逻的重点区域之外,每周报告也没有尝试预测如此暴力犯罪。即使像贾尼科夫斯基这样的信徒也很快指出,猜测,无论多么高科技和受过良好教育,也只能带你走这么远。“我更愿意将我们所做的事情描述为‘犯罪预测’,而不是‘犯罪预测’,”他说。这门科学是不完善的。
然而,即使警察无法预测谋杀案可能在哪里发生,一些研究人员认为,我们可以更好地确定谁可能实施谋杀案。宾夕法尼亚大学犯罪学教授理查德·伯克开发了一种算法,可以估算假释或缓刑人员杀人的概率。该算法基于对数万起案件的回顾,包括年龄、性别、犯罪类型和首次犯罪日期等变量。“在将要开枪的人中,该算法在大约 100 次中正确预测这些结果约 75 次,”伯克说。
如此强大的犯罪预测技术提出了一个令人不安的问题:我们是否在人们犯下罪行之前就判定他们有罪?像布兰廷厄姆这样的研究人员说,Blue CRUSH 等计划并非如此。“这不是关于预测特定个体的行为,”他说。“而是关于预测特定类型犯罪在时间和空间上的风险。”使用他的分析工具的警察部队并没有在自由公民犯罪前就将他们关起来;相反,他们将额外的巡逻人员引导到最有可能出现危险人员的地区。
与此同时,伯克的工作似乎更接近道德底线。假释委员会正在受到伯克关于哪些囚犯过于危险而无法释放的调查结果的影响。然而,对未来犯罪行为做出判断正是假释委员会应该做的事情,伯克说。唯一的区别是,他们现在正在使用计算机分析来增强他们以前几乎完全凭直觉所做的事情。
毋庸置疑
自从 MPD 开始用计算机分析来增强其直觉以来,严重的财产和暴力犯罪下降了令人印象深刻的 26%。然而,尽管所有明显的证据都支持预测性警务,但很难知道在孟菲斯和其他地方看到的犯罪率下降有多少是软件的结果。孟菲斯附近的大多数其他美国城市也报告了犯罪率的显着下降,并非所有城市都实施了类似于 Blue CRUSH 的行动。
此外,正如任何犯罪统计学家都知道的那样,您为基线选择的年份——所有未来的收益都将以此来衡量——在您的结果看起来有多令人印象深刻方面起着至关重要的作用。对于孟菲斯来说,与 2006 年进行比较是有意义的,因为那是 Blue CRUSH 在全市范围内推广的年份。但恰好 2006 年是整个十年中犯罪率最高的一年,这使得之后的所有年份相比之下看起来都不错。查看统计数据的另一种方法是将 2006 年至 2010 年这五年 Blue CRUSH 年份的平均犯罪率与 2001 年至 2005 年的前五年进行比较。从这个角度来看,孟菲斯发生的事情并没有那么神奇:后十年财产犯罪略有下降 8%,而暴力犯罪实际上上升了 14%。
贾尼科夫斯基说,Blue CRUSH 在犯罪率达到顶峰时推出并非巧合,也不是试图进行统计欺骗。“[在 2006 年] 我们知道,过去两年犯罪率一直在上升,而我们所做的一切都没有奏效,”他说。“我们必须尝试一些新的东西。”他指出,Blue CRUSH 行动中的许多方法,例如热点警务,实际上已在严格的大规模研究中得到验证,并且自 2006 年以来,犯罪率逐年下降。但是“预测性内容本身是否已得到科学证明?”他问道。“关于这一点,你可以合理地提出疑问。”
由于执法部门的人们都在寻找答案,国家司法研究所也参与了进来。它最近向美国七个城市警察局(包括波士顿、芝加哥、纽约、洛杉矶和华盛顿特区)发放了拨款,以评估预测性警务在精心控制的测试中的有效性。例如,洛杉矶警察局和布兰廷厄姆将比较城市中使用他的重复受害模型的地区的犯罪率与不使用该模型的地区的犯罪率。为了增强公正性,所有城市研究的结果还将由兰德公司进行额外审查。布兰廷厄姆谨慎乐观:“我们正处于警务新时代的风口浪尖,”他说。他很快就会证明这一点。
本文最初以“预防犯罪部门”为标题在印刷版上发表。