法医专家在判断两个笔迹样本是否匹配方面出人意料地出色

一项旨在反驳笔迹分析缺乏证据的研究表明,如果鉴定人员接受过正确的培训,笔迹分析是有效的

Search alamy All images Search alamy Stainless Steel Pen Laying on Written Page

在2020年美国总统大选之后,笔迹分析研究员玛拉·梅利诺接到一个奇怪的电话。电话中的人似乎想寻求她对一份高度可疑的报告的支持,该报告声称选票上的签名存在差异。梅利诺是肯塔基州立大学的心理学教授,她提出了一些尖锐的问题。在了解到,签名验证的参与者不是受过训练的专业人员等情况后,她得出结论,“关于这份报告的一切都是糟糕和错误的。”

新的研究为梅利诺的直觉提供了支持。研究发现,法医笔迹比对是一种有效的方法,但需要多年的专业培训,以确保在法律和行政案件中得出的结论的有效性。根据8月1日发表在《美国国家科学院院刊》上的研究结果,训练有素的专业人员可以可靠地识别出自同一人笔迹的样本,并在大多数时候做出正确的判断。相比之下,受过较少训练的人表现明显更差。

2009年,由于担心某些法医技术可能存在缺陷,国家研究委员会发布了一份报告,指出对于比较犯罪现场样本证据的方法(包括头发、咬痕和笔迹)的支持不足。2016年,时任总统巴拉克·奥巴马的一个顾问小组跟进发布了一份报告,呼吁对比较技术的准确性进行更多研究。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来能够继续报道关于塑造我们当今世界的发现和想法的具有影响力的故事。


梅利诺说,新的研究结果表明“这个过程的有效性和可靠性”,她没有参与这项工作。这项研究和其他研究的结果都“指向同一个方向,那就是经过充分培训的文件检验人员在他们做出的判断中是相当准确的。” 她补充说,越来越多的证据有助于回应批评,“即没有研究通过实证来支持这个领域的人可以做到他们声称能做到的事情。”

哈佛大学物理学教授、《美国国家科学院院刊》副编辑大卫·韦茨负责监督这项工作的同行评审过程,他说他认为这项研究作为一项“对法医分析的严肃科学研究”将非常重要,但他“并不总是相信法医分析是以真正科学的方式进行的。” 《大众科学》联系了这项由联邦调查局资助的研究的四位作者,但在出版前没有人接受采访。

为了这项工作,86名法医文件检验人员(其中大多数是政府雇员)使用230人产生的此类书写的数字图像进行了100次笔迹比较。在100项任务中,44项是比较同一人手写的文档,其余56项是比较两个人书写的文档。参与者不知道的是,十分之一的比较组是他们已经看过的组的重复——这是一种测试每个参与者随时间推移的一致性的方法。

未参与这项研究的认证法医文件检验员和研究员琳达·米切尔说,法医文件检验人员根据长长的因素列表比较样本。感兴趣的特征包括字母间距、字母的连接方式以及字母“腿”(如小写字母“g”的尾部或小写字母“d”的向上扫掠)在字母下方或上方的下降或上升。“有很多东西,”她说。

在联邦调查局的研究中,检验人员以五种评级形式表达了他们的结论:确定同一作者写了或未写比较样本,可能同一作者写了或未写比较样本,或无法得出结论。

总的来说,在3.1%的案例中,检验人员错误地得出结论,认为比较样本是由同一作者撰写的。不同的作者(双胞胎)更常使检验人员犯错,导致误报率达到8.7%。错误地归因于两个不同作者的样本的漏报率甚至更低,为1.1%。

米切尔说,双胞胎很棘手,因为相似的环境可能会在一些家庭中促成这些笔迹相似之处。“但最终,”她补充说,“总会有一些东西可以将你的笔迹与别人的笔迹区分开来。”

经验水平影响了检验人员的准确性和信心。与新手相比,接受过两年或更长时间培训的63名检验人员表现更好,也更谨慎——更倾向于依赖“可能”的结论。表现最差的九名参与者是23名接受培训较少的人员之一。“这就是培训的意义所在:确保你知道你不知道什么,”米切尔说。

在86名参与者中,有42人在至少一次比较中错误地得出结论,认为样本来自同一作者。但核心小组的八名参与者对这些错误中的一半以上负责——在114个错误猜测中占了61个。对于漏报,该小组在原始数字方面总体上做得更好:86人中只有17人犯了这个错误,而17人中的一人因做出超过五分之一的错误判断而脱颖而出。

事实证明,当被要求再次审查相同的文件时,检验人员相当一致,在他们审查过两次的案例中,只有1%的案例完全推翻了判断。他们更可能从确定转向可能,或反之亦然,而不是完全推翻一项发现。整个小组中只有一个人在所有第二次审查中都得出了相同的结论。参与者在检验人员之间也表现出相似的一致性,只有1.2%的案例完全推翻了结论。

梅利诺说,表达检验人员意见强度的五级量表代表着一个不断变化的指标。一些正在开发这些评估的小组已经尝试使用多达九个级别来表达意见的强度,但外行和专家如何解读这些发现之间存在差距,外行倾向于想要一个简单的“是”或“否”,而不是有保留的意见。“从我所看到的,五级不够,九级可能没有必要,但七级可能刚刚好,”梅利诺补充道。她说,理清这一点并阐明外行如何理解这种“意见语言”可能是未来研究中最重要的事情。

© . All rights reserved.