警方可能很快会有一种新的方法来抓捕那些在网上匿名散布虐童照片的恋童癖者。这项技术还可以通过其他方式帮助执法机构,例如识别使用被盗设备拍照并在互联网上发布快照的智能手机窃贼。
欧洲委员会联合研究中心公民保护与安全研究所的科学项目官员里卡多·萨塔(Riccardo Satta)在一月份在布鲁塞尔举行的计算机、隐私和数据保护会议上描述了他与研究员帕斯夸莱·斯特里帕罗(Pasquale Stirparo)共同完成的工作。* 关键在于能够发现每个数码相机在照片上留下的独特、不可去除的模式或“签名”。通过将特定相机的签名与在社交媒体上发布的图像中的签名进行比较,法医调查员将能够确定所有图像都是由同一台相机拍摄的。指向摄影师的其他上下文信息可以帮助调查人员缩小嫌疑人的范围。
萨塔描述的方法利用了数码相机传感器中的轻微缺陷。硅芯片中的微小变化会在光响应中产生差异,从而在它们捕获的每个图像中添加不一致的响应、干扰或“噪声”模式。目前的技术无法伪造或完全去除此签名。正如萨塔在一封电子邮件中指出的那样,“目前不可能将图像与噪声完美分离,修改噪声然后再将其添加回图像。试图通过用另一个噪声替换它来伪造它可能会产生许多可见的伪影,而去除它则可能会导致图像模糊且不自然。”
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的具有影响力的故事的未来。
这种传感器模式噪声(SPN)在 2000 年代中期被确定为每台相机独有的。萨塔在意大利卡利亚里大学获得计算机视觉和机器学习博士学位,他在 2011 年听到英国华威大学的张俊力(Chang-Tsun Li)介绍关于识别照片中噪声模式的新方法的工作时,“被使用噪声的可能性所吸引”。他们继续合作改进研究噪声和提取 SPN 的方法。
2012 年,萨塔开始尝试将给定相机的 SPN 签名与发布到社交网络帐户的照片进行匹配,萨塔将这种技术称为“图片到身份链接”。提取 SPN 在计算上是密集的,这是一个萨塔试图解决的问题。
调查人员早就知道数码相机在将光流转换为数字位时插入到图像中的其他标识符。但对于追踪图像来源而言,没有哪个像 SPN 那样可靠。例如,相机的软件可能会调整颜色、饱和度、光照水平和白平衡,以及在存储最终图像之前压缩文件。这些步骤中的每一个都会留下痕迹。这些伪影并非总是存在,因为许多现代相机允许摄影师绕过这种相机内处理。相机还会添加称为 Exif(可交换图像文件格式)的元数据,其中可能包括位置、日期、时间、相机制造商、型号、设置和版权信息。但据德蒙福特大学网络安全中心客座教授、英国最著名的数字取证专家之一彼得·索默(Peter Sommer)称,Exif 很容易被删除。当原始文件被更改时,例如通过调整大小、缩放、压缩、裁剪甚至社交媒体通常应用于发布图像的增强功能时,它通常也会丢失。
然而,萨塔能够表明的是,尽管社交媒体在上传照片时所做的修改会影响 SPN 并使提取 SPN 具有挑战性,但仍有足够的残留物来提供一致的标识符。然而,另一个困难来自于解释自然变化,例如不同光照水平的影响以及高度纹理化的物体(如网格和树木)形成的复杂图案。即便如此,在对来自 15 个不同的社交网络或博客身份的每个账户中的 2,896 张图像进行的初步研究中,萨塔发现 50% 的时间,单个图像可以准确地匹配到他的软件识别为最可能匹配的候选对象。萨塔还发现,图像可以根据原始相机准确地分组,准确率达到 90%,假阳性率为 2%。
这些比率不足以在法庭上用作指控犯罪嫌疑人的证据。但它们可以帮助选择调查目标,尤其是在社交网络上常见的其他信息(例如位置、好友列表和其他上下文数据)增强准确性的情况下。索默指出,根据他的经验,警方在建立案件时通常会从多条证据线中提取证据。他说:“在许多计算机取证中有一条规则。你要尽量避免依赖单条线索。单条线索可能会给你线索,但就呈现在法庭上而言,你将有多条不同的线索,并以这种方式在陪审团面前建立你的案件。”
萨塔接下来打算研究其他有助于创建独特签名的元素,例如镜头像差、相机内处理产生的伪影以及传感器上的灰尘颗粒。他还希望找到减少计算需求的方法,以便可以处理大型图像档案。
*编者注(2014 年 3 月 12 日):此句子在发布后进行了编辑。原文未包含萨塔的同事帕斯夸莱·斯特里帕罗。