捷克警方逮捕了一名男子,该男子涉嫌通过互联网网站提供搭车服务后强奸了 12 岁女孩。在俄亥俄州,一名 400 磅重的男子也同样利用网站冒充一名 15 岁男孩,以说服一名 12 岁女孩发送自己的裸照和录像带。英国的一次钓鱼执法行动取缔了一个恋童癖聊天室网站,该网站的负责人被抓获,并被发现藏有超过 75,000 张色情图片。
网络社交帮助连接了数百万互联网用户,但所有这些在线互动也可能带来严重的负面影响:恋童癖者大量涌现,他们使用代码字交易儿童色情制品,或在聊天室中徘徊并与未成年受害者交朋友,在他们的信息中夹杂着像“kewl”和其他青少年口语。
为了对抗犯罪分子(以及一些人担心的隐私问题),英国兰卡斯特大学的一组研究人员和英国儿童性侵害和网络保护中心 (CEOP) 的执法官员正在开发软件,该软件跟踪网络上不断演变的儿童色情词汇以及掠食者的聊天策略,以帮助执法机构在这些罪犯采取行动之前抓获最隐秘的罪犯。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您将帮助确保未来能够继续提供关于塑造我们当今世界的发现和想法的有影响力的报道。
“大约有 50 个关键词列表,这些关键词非常能指示儿童色情制品,”道格·斯金纳说,他是一名法证专家,在美国移民和海关执法局位于弗吉尼亚州费尔法克斯的网络犯罪中心工作*,有时作为全球虚拟任务部队的一部分与 CEOP 协调。但是,他说,“这些术语确实会发生变化。”
这就是为什么兰卡斯特大学计算机科学教授 Awais Rashid 发起了为期三年的Isis 项目,该项目使用语言分析来密切关注这些精通互联网的恋童癖者。“活动太多了,几乎不可能进行监管,”他说。目前,美国移民和海关执法局(美国国土安全部)和 CEOP 的调查人员只能等待潜在的受害者报告可疑活动,但到那时,往往为时已晚。
Rashid 的策略是创建自动化监控工具,聊天室、社交网络和文件共享网络的运营商可以将这些工具安装在他们的网站上。这将为执法官员提供一个自动更新的代码字词典,以及一个警报系统,该系统将在检测到用户伪装成儿童时通知他们。
为了准备编写文件共享网络的软件模块(年底前完成原型),该团队筛选了 2005 年 2 月 27 日至 3 月 27 日期间,排名第一的对等文件共享网络 Gnutella 上整整一个月的搜索流量。由于每个对等方都参与将网络消息路由到其他对等方和从其他对等方路由网络消息,Rashid 的团队可以设置一个专门的客户端来拦截和记录整个网络大部分区域的这些查询。然后,CEOP 的两位专家分析了来自三天内 10,000 个关键词搜索,以确定它们是否包含对儿童色情制品的引用。大约每 100 次搜索中就有一次是针对此类材料,大约 1.6% 的搜索结果包含此类材料。由于 Gnutella 网络的规模,当年用户人数为 181 万,因此每分钟都会进行数千次与儿童色情制品相关的搜索。相比之下,美国移民和海关执法局每年在美国逮捕约 2,500 名儿童性侵害罪犯。
即使是专家也对其中一些搜索中的密码感到困惑。大约 53% 的搜索词和 88% 的搜索结果包含 CEOP 未统计的代码字。该机构最终可能在其调查过程中发现了它们,但 Rashid 的团队意识到,借助计算机化策略,他们可以在这场“猫捉老鼠的游戏”中保持领先地位。
作为概念验证,一些不熟悉儿童色情词汇的人类志愿者被给予 10 个流行的 Gnutella 代码字,例如“ITA”(意大利)或“PTHC”(Preteen Hardcore),然后被要求猜测哪些与儿童色情制品有关。志愿者的成功率不到一半。但是,在这些相同的志愿者有机会查看包含这些关键词的整个搜索查询后,他们的成功率飙升至 94%。
Rashid 现在需要在模块中使用这个被称为搭配的原则,该模块将为执法部门提供一个不断演变的代码字“词典”。Isis 的第二阶段,用于监控聊天室,仍处于起步阶段,但不仅需要分析代码字,还需要分析词频和句子模式。
其他技术努力集中在为国家儿童受害者身份识别计划数据库开发图像分析软件,以及开发监控系统。例如,FBI 现已退役的食肉动物(Carnivore)系统,它不使用语言分析,但可以“嗅探”电子邮件流量并监控关键词。
一些专家对 Isis 计划持保留意见,特别是如果该计划允许执法机构在刑事调查之外收集特定个人的档案。“如果这是任何政府强制社交网络服务做的事情,”民主与技术中心的总法律顾问约翰·莫里斯说,“那么这将带来巨大的挑战。” 他说,他对社交网络自愿与执法机构合作并向客户披露其隐私惯例(就像他们现在所做的那样)没有问题,但政府的强制性规定将给那些在儿童色情制品传播中不起作用的网站带来巨大负担,并威胁到守法公民的隐私。“任何形式的强制性规定都存在一个巨大的问题,那就是很难定义什么是社交网站,而不会将这个国家的每个博客以及 eBay 和亚马逊都包括在内,所有这些都允许你拥有关于你自己的个人资料。”
伦敦大学学院的计算机科学家 Anthony Finkelstein 曾致力于开发隐私工具,以帮助机构共享有关儿童福利案例的数据,但他认为 Isis 项目的全面监控策略是被误导的。“我是否认为这是一个关键问题?总的来说,我没有 100% 确信,但我认为这值得进一步调查。” 他最大的担忧是,Isis 就像邻居令人恼火的家庭警报器一样,势必会产生大量误报,需要执法官员进行调查。“即使你能够识别出这些误报,”他说,“这也需要付出努力,而这些努力并没有投入到其他事情上。”
Finkelstein 认为,调查人员应该坚持传统的情报收集工作,而不是全面的监控计划,并且改善对青少年社会项目的资助可以防止他们成为在线恋童癖者的受害者。事实上,最近一项关于针对儿童的网络犯罪的研究估计,欺骗行为仅发生在 5% 的案件中,大多数非法活动涉及青少年,他们意识到自己要会见的是一个寻求性行为的成年人。
“我认为这是一个重要的研究领域,由有能力且积极性很高的人进行,”他说,“然而,归根结底,对于这是否是应该实施的正确类型的技术,还需要做出一系列艰难的选择。”
* 更正(2008 年 10 月 23 日):本文最初没有用全名和职称标识道格·斯金纳。