人们通常会与和自己相似的人共度时光,这使得数据科学家很容易通过分析他们的在线和现实世界的社交网络来推断个人的态度或性格属性。研究人员将这种寻找志趣相投的人的倾向称为“同质性”。斯坦福大学管理科学与工程研究员约翰·乌甘德说:“想想那句老话‘物以类聚,人以群分’,他研究的就是这个课题。”
但令人惊讶的是,乌甘德和他的研究生克里斯汀·M·阿尔滕伯格发现,有些人总是被那些具有某些不同属性的人所吸引。研究人员将这种现象引入的变异称为“异质性”。科学家们之前认为,异质性会使基于朋友网络得出关于人的结论变得更加困难。但乌甘德和阿尔滕伯格的研究表明,异质性产生了一种效应,即一个人的朋友的朋友在某些方面与他们相似,而直接的朋友可能并非如此。这可能使科学家比预期更容易推断出可能仍然隐藏的个人特征——这也是数据挖掘者追踪个人信息的又一种方式。
在3月份发表在《自然-人类行为》杂志上的一项在线研究中,乌甘德和阿尔滕伯格分析了三种不同类型的网络:一个在线社交网络、一个政治博客网络和一个经过充分研究的恐怖分子通信网络。《大众科学》与乌甘德谈论了这项研究及其对个人隐私的影响。以下是经过编辑的节选。
关于支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保未来能够继续报道关于发现和塑造我们当今世界的想法的具有影响力的故事。
“异性相吸”的想法是否引导您研究异质性?
引导我们进行这个项目的是一个基本的令人困惑的事实,即在线社交网络中几乎不存在性别同质性或持续的性别聚类。存在大量的年龄聚类。几乎没有性别同质性这一事实对信息传播和数据隐私产生了影响。事实证明,您仍然可以通过利用网络中的变异性,根据朋友的朋友的性别来预测人们的性别——这是我们花费大部分研究时间试图拆解和解释的反直觉起点。
在Facebook上拥有政治观点不同的朋友是异质性的一个例子吗?
就政治倾向而言,你倾向于与和你相似的人交往。也就是说,在博主网络中,当涉及到政治倾向时,我们确实看到了统计上显著的朋友差异性。有些人是跨界人士:他们运营自由派博客,但倾向于链接到保守派博客,反之亦然。
您是否看到在隐私担忧的背景下,社交网络的研究方式发生了变化?
我将自己视为一个试图发出警报并关注所有可能预测个人事物的方式的人。最近,公众就保护这些在线社交网络中连接所包含的信息的重要性进行了健康的对话。[披露:乌甘德在2010年至2014年期间隶属于Facebook数据科学部门。]
另一方面,根据人们在社交网络中的位置更好地了解他们是有好处的。许多社会科学研究都集中在识别真实的因果关系并排除混杂因素。我感兴趣的是了解当我们可能没有人口统计数据,但确实拥有这种非常丰富的社会关系网络时,我们可以在多大程度上描述个人。
您是否担心您的研究可能被用于不正当目的?
总是担心。当一个人构建工具时,他对这些工具的使用方式负有责任。我们研究的主要算法自2009年以来就已在科学文献中出现。之前人们认为,如果网络中存在朋友之间的相似性,这种方法可以有效地预测个人的态度或属性。但我们正在表明,这种方法的有效性不需要同质性或相似性。