去年,当SafeGraph 被抓到出售计划生育中心访客的位置信息时,这家数据经纪人通过移除其计划生育中心数据来回应公众的强烈抗议。但首席执行官奥伦·霍夫曼(Auren Hoffman)试图扭转局面,声称他的公司收集和分享敏感数据的做法实际上是造福社会的关于堕胎途径的研究的引擎——用科学作为破坏人们隐私的盾牌。
SafeGraph将隐私掠夺行为掩盖在科学之下,这只是整个行业推诿塞责的一个例子。其他公司,如Veraset、Cuebiq和X-Mode,也与学者合作开展所谓的“数据为善”项目,并抓住新冠疫情扩大这些项目。这些经纪人向学术研究人员提供位置数据,这些研究人员在诸如《自然》和《美国国家科学院院刊》美国。等刊物上发表了著名的论文。然而,2020年,Veraset还在未经华盛顿特区官员同意的情况下,向他们提供了数十万人的批量位置数据。并且,今年一份拟议的集体诉讼将Cuebiq、X-Mode和SafeGraph列为从家庭跟踪应用程序Life360购买位置数据而未经用户同意的数据经纪人。
数据经纪人正在购买和出售数亿人的位置信息,太多的研究人员在使用科学研究中的数据时,无意中为这种大规模的隐私侵犯提供了公共关系掩护。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
研究人员必须认真考虑此类数据是否会使他们成为这种可疑行为的帮凶。立法者必须立即采取行动,阻止这种践踏美国人隐私权的行为。必须拆除阻止对数据经纪人滥用行为进行全面审查的法律障碍。
霍夫曼在2022年5月接受现已倒闭的科技新闻网站Protocol采访时辩称,移除诊所数据才是真正的问题:“一旦我们决定撤下数据,我们就收到了数百名研究人员的抱怨,”他说。然而,当被追问时,他无法说出任何人的名字——而且事实仍然是,在美国最高法院对多布斯诉杰克逊妇女健康组织案裁决之后,这些数据将实际的堕胎寻求者、提供者和倡导者置于危险之中。
像SafeGraph、Veraset和其他公司这样的位置数据经纪人根本不符合研究人员被要求的人体受试者标准,首先是他们的商业惯例中始终缺少有意义的“选择加入”同意。数据经纪人经常辩称,他们收集的数据是选择加入的,因为用户已同意与应用程序共享该信息——即使绝大多数用户都不知道这些信息会被偷偷出售给经纪人,而经纪人又将其出售给企业、政府、地方执法部门和其他机构。
事实上,谷歌认为SafeGraph的做法太过分,以至于它禁止任何使用该公司代码的应用程序进入其Google Play应用商店,苹果和谷歌都禁止X-Mode进入各自的应用商店。
此外,尽管这些公司对匿名化提出了苍白的辩解,但输入数据经纪人产品的数据很容易与可识别的人联系起来。关于一个人去过哪里的信息本身就足够了:一项2013年广为引用的研究发现,研究人员仅使用两个随机选择的时间和位置数据点,就可以唯一地识别出50%的人。
由于社交媒体和智能手机使用的快速增长,如今的数据经纪人从比2013年更广泛的来源收集敏感的用户数据,包括移动应用程序后台的隐藏跟踪。虽然技术各不相同,并且常常被保密协议(NDA)所掩盖,但他们收集和处理的原始数据是基于敏感的个人位置轨迹。
聚合位置数据有时可以保护个人隐私,其保障措施考虑了数据集的大小和所包含的数据类型。但是,没有任何保护隐私的聚合协议可以证明在未经人们同意的情况下最初收集位置数据是合理的。
数据经纪人的产品出了名的容易被重新识别,尤其是当与其他数据集结合使用时——而这正是某些学术研究正在做的事情。研究已经将数据经纪人位置与人口普查数据、实时谷歌地图交通预估、当地家庭调查和联邦公路管理局的数据结合起来。虽然研究人员似乎致力于构建最可靠和最全面的数据集,但这种合并也是重新识别数据的第一步。
在层层保密协议的背后,数据经纪人通常对其商业行为以及构建其数据库的数据聚合器、广告技术交易所和移动应用程序网络进行隐藏,以逃避审查。这应该对机构审查委员会(IRB)发出警报,机构审查委员会负责监督涉及人体受试者的拟议研究,并且机构审查委员会需要了解数据经纪人及其合作伙伴是否以及如何实际获得用户的同意。同样,学者们自己也有兴趣确认他们工作所依赖数据的完整性和来源。
在没有这种准确性和验证的情况下,一些研究人员用模仿营销语言的空话来混淆数据经纪人的信息。例如,一篇论文将SafeGraph数据描述为“匿名化的人类移动数据”,另一篇论文称其为“来自选择加入的智能手机GPS跟踪的人流数据”。第三篇论文将数据经纪人Spectus描述为提供“匿名的、符合隐私规定的位置数据”,并具有“坚如磐石的隐私框架”。这些都不接近全部真相。
一篇《自然》论文甚至自相矛盾地将Veraset的位置数据描述为既“精细的”又“匿名的”。它的具体数据点包括“匿名设备ID”和“设备停留时间超过五分钟的居住点的时间戳和精确地理坐标”。如此精细的数据不可能是匿名的。
在公司遵守数据隐私和透明度要求之前,学术数据共享计划仍将是虚伪的公共关系伎俩。经纪人提供的敏感位置数据只能在获得明确的知情同意后才能收集和使用,并且受试者必须有权随时撤回该同意。
我们需要全面的联邦消费者数据隐私立法来执行这些标准——远比国会迄今为止提出的更为全面。这样一项法案绝不能抢占甚至更严格的州法律的先机;它应该充当底线而不是上限。它必须包括私人诉讼权,以便普通人可以起诉侵犯其隐私权的数据经纪人,以及强有力的最小化条款,这将禁止公司处理个人数据,除非是严格必要地为他们提供他们要求的服务。该法案还必须禁止公司处理个人数据,除非获得他们知情的、自愿的、明确的、选择加入的同意——而不是现在经常存在的选择退出情景——并且必须禁止按隐私付费计划,即公司向那些拒绝放弃隐私权的人收取更多费用或提供较低质量的服务。
我们必须剥离保密协议,以便研究数据经纪人本身:他们的商业行为、他们的合作伙伴、他们的数据可能被滥用的方式,以及可以采取哪些步骤来保护他们置于危险之中的人们。
数据经纪人声称他们正在为科技行业带来透明度或“普及数据访问”。但他们的科学数据共享计划只不过是试图控制围绕其不受欢迎的和未经同意的商业行为的叙事。关键的学术研究绝不能依赖于以利润为驱动的数据管道,这些管道在没有获得有意义的同意的情况下,危及数百万人的安全、隐私和经济机会。
这是一篇观点和分析文章,作者或作者表达的观点不一定代表《大众科学》的观点。