美国国家安全局和其他机构是如何收集和使用我们的数据的?

一位元数据专家揭示了政府和公司收集个人数据所带来的令人警醒的后果

本月早些时候,前美国国家安全局雇员爱德华·斯诺登 披露,该机构正在收集数百万美国人的数据,从通话时长到 Facebook 帖子,所有这些都通过一个代号为 PRISM 的项目进行。由此引发的媒体强烈反对重新引发了关于互联网隐私和政府监控技术的辩论,但问题仍然存在:国家安全局是如何获取数据的?这种数据收集工作对我们的公民自由构成了多大的威胁?

为了找到答案,《大众科学》采访了元数据专家马克·赫施伯格,他是 Madison Logic 的首席技术官,也是麻省理工学院的讲师。赫施伯格曾参与使用用于收集大数据的程序,并且能够阐明我们的互联网数据是如何成为一种重要的——如果不是侵入性的——商品的。

以下是采访的编辑稿。


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和想法的具有影响力的故事。


可以使用哪种软件来收集大数据?

可以通过多种不同的方式收集数据。听起来美国国家安全局正在进入 Facebook 和其他公司的服务器,并通过某种“后门”访问他们的日志文件。 在这种情况下,您可以编写非常简单的程序来复制这些文件并将它们传输到本地服务器。您还可以通过在个人计算机上安装间谍软件来获取这些数据。第三种选择实际上是通过管道监听,这是数字版本的电话窃听。

当个人下载某些内容或访问网页时,所有数据都通过互联网服务提供商。 通过有效地窃听他们的线路,您可以看到他们来回发送的每一个字节。 

为什么美国国家安全局想要访问像 Facebook 帖子这样的内容?

您可以获得的是信号。例如,如果您观察青少年自杀,他们通常会花费大量时间思考和计划。 专业人士已经接受过培训来寻找一些迹象,例如在他们结束自己生命之前向人们道别。

同样,您可能会在坏人采取行动之前从他们身上看到信号。 他们可能会改变他们的习惯。 这些是反恐专业人士可以解读的事情。

您还可以使用个人数据来找出人们去过哪里以及他们在做什么。 用手机拍摄的照片包含地理标记信息:我可以查看某人发布的照片,并准确知道照片是在哪里拍摄的。

我们还可以看到谁在与谁交谈,并观察到重要的变化。 我给您举个例子:假设有一栋房子,有人进进出出。 我实际上看不到进进出出的人,但我可以看到停在这栋房子前的汽车数量。 假设我通常每天看到两到三辆车,而今天我突然看到 20 辆车停靠。 这告诉我有些事情正在发生。 即使您无法获得详细信息,仅查看通信模式的变化也可以提醒您正在发生某些事情。

有很多信息需要收集和存储。 美国国家安全局如何才能对所有这些数据进行编目?

我怀疑美国国家安全局并没有关于我们每个人的大型文件。 我确信他们掌握了关于特别知名的目标的信息,但我认为您和我不在监视名单上。

布鲁斯特·卡勒 制作了一个模型,该模型表示,如果有人将一年内所有国内电话通话都放入云存储,那么每年的存储成本约为 2700 万美元。 对于像美国国家安全局、国防部和其他机构来说,这只是小菜一碟。 如今,存储变得如此便宜,以至于我们可以以相对较低的成本存储大量数据。

当您考虑一个人一年可以拨打的电话数量时,这有一个上限。 技术不允许我说得更快——我们拨打电话的数量并没有比几年前高出多少,但存储容量却增加了许多倍。 我们的存储能力超过了我们产生信息的能力。 我们发送的电子邮件比几年前更多,但在某个时候,我只能快速地发出电子邮件。 但是存储这些电子邮件的能力呢? 这种情况继续呈指数级增长。

您是否预见到未来实体会存储我们产生的所有信息?

这不是未来。 这是现在,它被称为 Google,它被称为 Yahoo,它被称为 Facebook。 Facebook 已经保存了您通过 Facebook 发送过的每一条 IM。 Google 已经保存了您通过 Gmail 发送的所有电子邮件。 他们拥有这些数据,他们已经对其进行了索引,并且他们已经生成了关于您的模型。 这不是未来;这是过去几年发生的事情。

这种数据收集是为了广告目的吗?

绝对是。 在广告中,零售商建立某些模型。 如果我每周都买啤酒和薯片,然后突然他们看到我买了验孕棒,然后他们看到我买了尿布。 他们可能会说“哦,好的。 单身生活结束了。 我们知道发生了什么,我们将向这个人发送关于婴儿产品的信息。” 每个人都在进行预测建模。

关于这一点,您是否认为这里存在隐私问题?

存在巨大的隐私问题。 这里有一个 来自美国公民自由联盟的精彩视频,内容是关于未来订购披萨的,它总结了这一点。 实际上没有任何数据隐私法到位。 就网站或零售商可以追踪您的信息而言,我不知道有任何关于这个主题的法律。

我们个人通常将这些信息的价值评估为零。 在研究中,研究人员问人们:“对于这个特定的网站或服务,我们将给您两个选择:您可以付费使用它,或者您可以免费使用它,但它带有广告。” 每个人都选择了免费使用并带有广告。 他们没有意识到,或者他们知道但不在乎的是,这些广告带有跟踪 cookie。 他们正在收集关于我们的大量数据集,而我们美国人似乎并不介意。 无论是在文化上还是在法律上,我们似乎都不在乎。 我认为这非常不幸。

除了反恐和广告之外,我们还可以用数据收集做任何绝对 积极的事情吗?

大数据是一种工具,就像任何工具一样,它可以用于好的方面或坏的方面。 互联网可以用来传播规模难以想象的信息,也可以用来传播儿童色情内容。 因此,这实际上掌握在使用它的人手中。

我们可以建立以前从未有过的模型。 在犯罪方面,纽约以 Compstat 系统 而闻名,警察可以在该系统中查看发生了哪些犯罪以及何时何地发生。 他们根据此分配警力。 更高效的警察队伍对社会来说是美好的。

同样,这些模型可以用于好的方面或坏的方面。 这些警察可以用来阻止罪犯,或者在极端的警察国家中,这些警察可以用来镇压异议者。

最后,公司正在收集关于我们的海量数据,我认为这对个人的威胁与政府数据收集可能造成的威胁一样大。 

© . All rights reserved.