揭示网络阴暗角落

网络犯罪研究员吉安卢卡·斯特林吉尼解释了他如何研究地下网络 4chan 上的仇恨言论和虚假新闻

吉安卢卡·斯特林吉尼每天都在互联网上一些阴暗的角落度过。作为伦敦大学学院的网络犯罪研究员,他研究过勒索软件、在线约会诈骗和洗钱。今年 5 月,他的团队发表了两篇论文,探讨仇恨言论和虚假新闻如何在互联网上传播,重点关注臭名昭著但受欢迎的 4chan 留言板。

在一篇会议论文集中,研究人员分析了 4chan 的 /pol/(“政治不正确”)版块上的 800 万条帖子,并追踪了其用户如何通过发布煽动性评论“攻击”其他网站1。在一篇发布在 arXiv 服务器上的预印本中2,他们追踪了 4chan 版块与其他在线社区(如 Twitter 和 Reddit)之间的互动,以检查网站如何分享来自已知虚假新闻网站或团队所谓的“另类”新闻来源(如 RT(前身为今日俄罗斯))的链接。斯特林吉尼与《自然》杂志谈论了他的研究。

是什么让您决定研究 4chan?


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来能够讲述关于塑造我们当今世界的发现和思想的具有影响力的故事。


没有人真正关注这些社区,但有很多传闻证据表明,它们通过传播某些类型的新闻对现实世界产生影响。因此,我们想了解这是否属实,以及它们在多大程度上真正影响了网络的其他部分。

我们首先只关注 4chan。我们选择了 /pol/,即政治不正确的版块,这是大多数另类右翼用户聚集和讨论他们世界观的地方。我们首先尝试了解这些人群和这项服务的动态。4chan 与大多数其他在线网站非常不同,因为它既是匿名的,而且其帖子也是短暂的:它们会在短时间内被删除。

您是如何开展这项研究的?

我们应用了多种技术。我们使用了一个包含仇恨词语的数据库来了解最突出的仇恨词语是什么,仇恨言论的发生率等等。

/pol/ 帖子中包含仇恨言论的百分比为 12%,而 Twitter 上为 2%。可以说,它相对较高。这并不完美,因为我们使用了基于关键词的列表,因此我们实际上可能会遗漏一些不属于这些预编译类别的仇恨言论。在了解了这是如何运作的之后,我们开始研究 4chan,特别是 /pol/,如何影响网络的其他部分。

这就是您的论文1关于从 4chan 到其他网站的“攻击”的主题吗?这是您已经认为正在发生的事情吗?

是的。到目前为止,研究界成员所做工作的局限性在于他们孤立地看待这些服务。在了解攻击如何在 Twitter、YouTube、Facebook 上发生方面做了很多工作。但是,关于这些攻击的来源或其原因的工作并不多。

由于 /pol/ 是这样一个充满仇恨的平台,我们凭经验看到,人们经常会发布指向与他们的世界观背道而驰的 YouTube 视频的超链接。它们可能是倡导性别平等、女权主义、宽容的视频。然后他们会呼吁成员去攻击这些人。

因此,我们会在 4chan 上收到一个信号,表明已发布此链接,并且人们正在谈论它。然后我们可以看看是否可以观察到对该视频的 YouTube 评论产生影响。我们基本上应用了无线电信号中使用的信号处理技术,以了解这两个信号的同步程度。YouTube 上的评论在 4chan 帖子的生命周期内激增,并且这些评论中的仇恨言论数量之间存在很强的相关性。这为我们提供了证据,证明这些攻击确实正在发生,这将为未来的工作奠定基础。现在的问题是,“那又怎样?”我们该怎么办?

可以做些什么吗?

这为我们提供了一个机会来识别有被攻击风险的视频。如果 YouTube 仅使用自己的平台来识别攻击,它基本上可以在攻击发生时识别它们。但是,如果它也关注其他内容——一个指标,表明有人在不同的平台上以仇恨的方式谈论这个视频——也许它应该开始更仔细地监控评论。或者,鉴于 4chan 上的这些帖子寿命很短,YouTube 应该在该视频的生命周期内禁用评论。

在您关于 arXiv 的论文中2,您表明 4chan 版块可以影响其他新闻来源的分享。

在这里,我们研究了一个事件一旦在一个互联网平台(例如,指向一篇新闻的超链接)上发生,同一事件是否会在另一个平台上发生。这将是在 /pol/ 上发布的完全相同的新闻链接,然后它会传播到 Twitter,比方说。我们使用一种称为“霍克斯过程建模”的数学技术,我们可以合理地确信,特定事件实际上与先前发生的事件有关。

因此,我们进行了这项研究,这是首次追踪服务之间链接的研究。这里的想法是,在研究虚假和另类新闻方面已经做了相当多的工作。例如,人们关注另类新闻如何在 Twitter 上传播;人们如何转发它。但是这些服务并非生活在真空中——它们是更广阔网络的一部分。这些另类新闻故事被发布的地方,他们谈论它们,他们编造这些疯狂的阴谋论以及所有这些:我们想了解这是否真的对更广泛的网络产生影响。

我们发现 Twitter 对其他服务的影响很大,这很有道理。/pol/ 和 reddit 的用户会在 Twitter 上看到新闻,然后他们会将这些故事发布到自己的版块上并谈论它们。但我们也发现相反的情况也会发生。举个例子,我们发现 worldnews(reddit 上的主要新闻版块之一)上大约 12% 的另类新闻来自 4chan。同一版块上超过 16% 的另类新闻来自 The_Donald [美国总统支持者使用的 Reddit 的特定部分]。

阅读所有这些帖子令人不愉快吗?

这绝对是一个充满仇恨的地方,而且非常令人不愉快。看到它并不舒服。我和我的同事们有一些最佳实践:我们建议与我们合作的任何人不要连续在网站上花费太多时间,并且要休息一下。我们有一个内部笑话,时不时地去看一些猫的照片。

本次采访为了篇幅和清晰度进行了编辑。

本文经许可转载,并于2017 年 6 月 9 日首次发布

© . All rights reserved.