互联网比你的配偶更了解你

我们在网络和数字设备上留下的痕迹可以让广告商和其他人对我们的心理产生令人惊讶,有时甚至是令人不安的见解

如果你喜欢计算机化的性格测试,你可能会考虑访问“应用魔力酱”(Apply Magic Sauce)(https://applymagicsauce.com)。该网站会提示你输入一些你写过的文本,例如电子邮件或博客,以及你在社交媒体上的活动信息。你不必提供社交媒体数据,但如果你想这样做,你可以允许“应用魔力酱”访问你的Facebook和Twitter帐户,或者按照指示从这些来源上传选定的数据,例如你按下Facebook“赞”按钮的历史记录。一旦你点击“进行预测”,你将看到一份详细的心理图,或性格概况,其中包括你推测的年龄和性别,你是否焦虑或容易感到压力,你屈服于冲动的速度有多快,以及你在政治和社会上是保守还是自由。

检查算法从你的在线痕迹中得出的心理概况肯定很有趣。另一方面,该算法推断我们的能力说明,任何跟踪我们数字活动的人都可以很容易地了解我们的性格,并可能侵犯我们的隐私。更重要的是,关于我们的心理推断可能会被利用来操纵我们购买什么或如何投票。

惊人的准确性


支持科学新闻

如果你喜欢这篇文章,请考虑订阅我们的获奖新闻,以支持我们 订阅。通过购买订阅,你正在帮助确保关于塑造我们当今世界的发现和想法的有影响力的故事的未来。


似乎我们的点赞本身就可以很好地表明是什么让我们运转。2015年,剑桥大学的David Stillwell和Youyou Wu以及斯坦福大学的Michal Kosinski证明,算法可以通过仅检查Facebook用户的点赞来相当准确地评估心理学家所说的性格的“五大维度”。这些维度——对经验的开放性、尽责性、外向性、宜人性和神经质——被认为是代表了性格的基本维度。它们在个体中存在的程度描述了那些人是谁。

研究人员使用来自70,000多名Facebook用户的数据训练了他们的算法。所有参与者都早些时候填写了一份性格问卷,因此他们的“五大维度”概况是已知的。然后,计算机浏览了这些测试对象的Facebook帐户,寻找通常与某些性格特征相关的点赞。例如,外向的用户经常为诸如“聚会”或“跳舞”之类的活动点赞。特别开放的用户可能会喜欢西班牙画家萨尔瓦多·达利。

然后,研究人员让该程序检查其他Facebook用户的点赞。如果该软件的分析数据少至10个,它就能像同事一样准确地评估那个人。如果有70个点赞,该算法的准确性与朋友差不多。如果有300个,它比那个人的配偶更成功。更让研究人员惊讶的是,将点赞输入他们的程序使他们能够预测某人是否患有抑郁症或吸毒,甚至可以推断出该个人在学校学习的内容。

该项目源于Stillwell于2007年开始的工作,当时他创建了一个Facebook应用程序,使用户可以填写性格问卷并获得反馈,以换取允许研究人员使用该数据进行研究的许可。共有600万人参与,直到该应用程序于2012年关闭,其中约40%的人允许研究人员访问他们过去的Facebook活动,包括他们的点赞历史记录。

世界各地的研究人员对该数据集非常感兴趣,其中部分数据集以匿名形式提供给非商业研究。已有50多篇文章和博士论文基于此,部分原因是Facebook数据显示了人们在不知道自己的行为是研究对象时实际所做的事情。

商业应用

除了研究领域之外,这种心理洞察力的一个明显用途是在广告中,正如哥伦比亚大学的Sandra C. Matz及其同事(其中包括Stillwell和Kosinski)在2017年的一篇论文中所证明的那样。该团队利用了Facebook向其商业客户提供的东西:能够将广告定位到具有特定点赞的人。他们为同一化妆品开发了10种不同的广告,其中一些旨在吸引外向型女性,而另一些则旨在吸引内向型女性。例如,其中一个“外向型”广告显示一个女人在迪斯科舞厅里尽情跳舞;在它下面,标语写着:“像没人看着一样跳舞(但他们完全在看)。”一个“内向型”广告显示一个年轻女人在镜子前化妆。标语说:“美丽不必大声喧哗。”

这两项广告活动在Facebook上运行了一周,共覆盖了约300万女性Facebook用户,她们收到了与她们的性格类型或与她们的性格类型相反的信息。当广告符合性格时,Facebook观众购买该产品的可能性比广告不符合性格时高出约50%。

针对外向者的广告

针对内向者的广告

“像没人看着一样跳舞(但他们完全在看)。”

“美丽不必大声喧哗。”

两项不同的化妆品广告活动旨在吸引外向者或内向者,并在2017年的一项研究中向女性Facebook用户展示。当广告符合女性的性格时,销量最高。这里的广告是使用的10个广告之一。资料来源:Paul Bradbury Getty Images ()Getty Images

广告商通常采取不同的方法:他们寻找过去购买或喜欢特定产品的客户,以确保他们将目标锁定在那些已经对他们的商品有好感的人。Matz说,在限制目标群体时,考虑到以前的消费是有道理的,但这项研究证明了根据消费者的性格调整信息传递方式的力量。

营销人员没有失去这种力量。许多公司已经发现了自动化性格分析,并将其转化为商业模式,吹嘘它可以为其客户提供的价值——尽管任何一家公司使用的方法的实际效果如何很难判断。

现已倒闭的剑桥分析公司提供了一个臭名昭著的例子,说明了如何将基于Facebook数据的性格分析应用于现实世界。2018年3月,新闻报道称,早在2014年,该公司就开始购买有关超过8000万用户的个人Facebook数据。(Stillwell的研究小组强调,剑桥分析公司无权访问其数据、算法或专业知识。)该公司声称专门从事个性化选举广告:政治信息的包装和精确定位。2016年,时任该公司首席执行官的Alexander Nix在纽约市的一次演示中描述了剑桥分析公司的策略,并提供了一个如何说服关心枪支权利的人支持选定候选人的例子。(请观看他在YouTube上的演讲视频,网址为www.youtube.com/watch?v=n8Dd5aVXLCc。)对于被认为是神经质的选民(容易担心的人),Nix提出了一个基于情感的活动,以入室盗窃的威胁和枪支的保护价值为特色。另一方面,对于性格随和的人(重视社区和家庭的人),这种方法可以以父亲教儿子打猎为特色。

剑桥分析公司为特德·克鲁兹和唐纳德·特朗普的总统竞选活动工作。尼克斯在演讲中声称,该策略帮助克鲁兹在初选中取得进展,该公司后来为特朗普的胜利邀功——尽管它为特朗普的竞选活动做了什么以及它的工作价值如何存在争议。

哲学家Philipp Hübl(除其他外,他还研究无意识的力量)对特朗普的说法表示怀疑。他指出,正如Matz的研究那样,销售价值几美元的化妆品与在竞选活动中说服选民截然不同。Hübl说:“在选举中,即使是犹豫不决的选民也会权衡各种可能性,仅仅靠一些横幅广告和虚假新闻是无法说服他们的。”

Matz也看到了心理营销在其当前发展阶段可以在政治竞选活动中实现的局限性。她说:“尤其是不确定的选民可能会更容易接受某种立场,但是将克林顿主义者变成MAGA选民,嗯,这不太可能发生。”尽管如此,Matz认为这种营销可能会对选民产生一定的影响,称其没有影响的观点是“极不可能的”。

超越Facebook

Facebook活动绝不是唯一可以用来评估你的性格的数据。在2018年的一项研究中,德国斯图加特大学的计算机科学家Sabrina Hoppe及其同事为学生配备了眼动仪。然后,志愿者们在校园里走动并购物。根据他们的眼球运动,研究人员能够正确预测“五大维度”中的四个。

我们说话的方式——我们个人的语调——也可能泄露我们性格的线索。Precire Technologies是一家总部位于德国亚琛的公司,专门从事口语和书面语言的分析。它开发了一种自动化的工作面试:求职者通过电话与计算机交谈,然后计算机根据他们的回答创建详细的心理图。除其他外,Precire还会分析单词选择和某些单词组合、句子结构、方言影响、错误、填充词、发音和语调。其算法基于对5000多名个性经过分析的个人的面试数据。

Precire的客户包括管理法兰克福机场的德国公司Fraport,以及国际招聘机构Randstad,后者将该软件用作其选择过程的一部分。Randstad德国分公司的人事主管Andreas Bolder表示,该方法比某些更耗时的测试更有效、成本更低。

还在探索分析面部以寻找情绪、性格或其他心理特征线索的软件。它突出了可能发生的事情以及需要恐惧的事情。

可能性和问题

2018年初,在黑客大会nwHacks上,四位程序员推出了一款应用,通过分析iPhone X前置摄像头捕获的面部追踪数据来识别情绪。这款名为Loki的应用可以实时识别用户在浏览新闻时表现出的快乐、悲伤、愤怒和惊讶等情绪,并根据用户的情绪状态推送内容。在一篇关于Loki的文章中,其中一位开发者表示,他和同事们创建这款应用的目的是“为了说明社交媒体平台追踪用户情绪以操纵向他们展示的内容是可行的”。例如,当用户浏览新闻或使用其他应用时,此类软件可能会秘密追踪用户的情绪,并将此“情绪检测器”作为定向投放广告的指南。研究表明,人们在心情愉悦时往往会更愿意花钱;广告商可能希望在你心情特别好的时候向你的手机推送广告。

令人惊讶的是,Loki只用了24小时就完成了开发。在开发过程中,开发者们依赖于机器学习,这是一种常见的自动化图像识别方法。他们首先使用大约100种面部表情训练程序,并为每种表情标记了相应的情绪。这种训练使应用能够“理解”面部表情与情绪之间的关系,例如,当我们微笑时,嘴角会上扬。

科辛斯基也研究了自动化图像识别技术是否可以秘密地从数字活动中识别心理特征。在2018年发表的一项实验中,他和他的斯坦福大学同事王一伦将数十万张约会门户网站的照片以及照片中人物的性取向信息输入计算机。然后,他们向软件展示了成对的未知面孔:一张是同性恋者,另一张是同一性别的异性恋者。该程序在81%的时间内正确区分了男性的性取向,在71%的时间内正确区分了女性的性取向;而人类的判断准确率要低得多。

鉴于同性恋者在世界许多地方仍然面临生命威胁,结果引发负面反应也许并不令人意外。事实上,科辛斯基收到了死亡威胁。“人们不理解我的意图不是为了展示预测性取向有多酷,”科辛斯基说。“整篇论文实际上是一个警告,呼吁加强隐私保护。”

通过分析面部的83个测量点,一种算法可以根据约会门户网站上男性的照片正确识别出他们的性取向。此外,该程序生成了所谓的“典型异性恋”()和“典型同性恋”()面孔,并计算了平均面部表情的差异()。研究人员表示,他们进行这项研究的部分原因是警告人们,互联网上发布的照片可能会被挖掘出私人数据。来源:王一伦和米歇尔·科辛斯基;资料来源:“深度神经网络在从面部图像检测性取向方面比人类更准确”,米歇尔·科辛斯基和王一伦著,刊登于《人格与社会心理学杂志》,第114卷,第2期;2018年2月。

2016年末,苏黎世联邦理工学院的计算机科学家们证明,如果将Facebook用户的点赞与其个人资料照片分析相结合,可以更精确地确定他们的性格。有趣的是,研究人员,像许多其他使用机器学习软件的人一样,并不确切知道算法是如何形成判断的——例如,它是否依赖于诸如一个人的发型或个人着装的正式程度等特征。他们对此一无所知,因为机器学习程序不会透露他们在得出结论时所应用的规则。研究人员知道该软件会在数据中的特征和性格之间找到关联,但并不确切知道它如何得出照片中的男人对其他男人有吸引力,或者我的电子邮件中的哪些特征可能表明我是一个认真且有些内向的人。

“我们经常得到的印象是,预测性格是一种魔法,”参与瑞士研究的拉斯穆斯·罗特说。“但在最终分析中,计算机模型所做的只不过是找到相关性。”

面部识别技术用于分析心理学不仅仅是研究对象。它已被多家商业企业采用。例如,以色列公司Faception表示,它可以识别一个人是否具有高智商、恋童癖倾向或是否构成潜在的恐怖主义威胁。

即使找到了与某种特质的关联,专家们仍然对这种分析的实用性表示怀疑。“算法给我们的所有东西都是统计概率,”罗特说。不可能确定一个人是否是门萨俱乐部成员。“该程序可以告诉我们的是,看起来有点像你的人在统计学上更有可能拥有高智商。它很容易猜错十分之四。”

在某些应用中,不正确的预测是可以容忍的。谁会关心Apply Magic Sauce得出可笑的错误结论呢?但在其他情况下,其影响可能是毁灭性的。值得注意的是,当分析的特征不常见时,更容易出现错误。即使一家公司的计算机算法能够以99%的准确率正确识别恐怖分子,但在人口稠密、恐怖分子罕见的地区,如德国或美国,1%的错误肯定会给成千上万的无辜人民带来伤害。

语言识别与自杀预防

当然,自动心理评估可以用来帮助人们过上更好的生活。自杀预防工作就是典型例证。Facebook就有这样一个项目。该公司注意到,其平台上的用户偶尔会宣布他们打算自杀。有些人甚至直播了自己的死亡过程。现在,一种自动语言处理算法被编程为向社交网络的联系检查员报告自杀威胁。如果一位训练有素的审查员确定某人有危险,该人就会被显示支持选项。

根据位于弗吉尼亚州阿灵顿的Qntfy公司的研究员格伦·库珀史密斯的说法,推特帖子也可能值得分析,该公司结合数据科学和心理学来创建公共卫生技术。库珀史密斯指出,推特消息有时包含强烈的自杀风险证据,并认为应认真考虑将其用于筛查。

德累斯顿卡尔·古斯塔夫·卡鲁斯大学医院采取了不同的方法,正在使用智能手机来测量行为变化,寻找重度抑郁症的特征。特别是,它正试图确定患有双相情感障碍的患者何时处于躁狂或抑郁阶段(参见“智能手机分析:防止崩溃”)。

即使是出于善意创建算法的设计者也必须在潜在的益处与侵犯隐私的风险之间取得平衡。撒玛利亚会是一个旨在帮助英国和爱尔兰有自杀风险的人的非营利组织,几年前就意识到了这一点。2014年,它推出了一款应用程序,扫描推特消息中是否存在情绪困扰的证据(例如,“厌倦了孤独”或“讨厌自己”),使推特用户能够了解朋友或爱人是否正在经历情绪危机。但是,撒玛利亚会没有征得推文被收集的人的同意。对该应用程序的批评铺天盖地。该程序启动九天后,撒玛利亚会就将其关闭。德累斯顿医院没有犯同样的错误:在监控参与者的智能手机使用情况之前,它会征得他们的许可。

自动心理评估正成为数字景观的一部分。它们最终主要是用于善还是用于恶,仍有待观察。


智能手机分析:防止崩溃

如果简·史密斯(化名)早上在床上睡觉,错过了课程,他的缺席肯定会发出警报。这是因为这位25岁的学生有一个虚拟伴侣,它非常了解他日常生活中的细节——他何时散步和在哪里散步,他多久给朋友打电话,他在电话上停留多长时间等等。它知道他昨晚深夜发送了四条WhatsApp消息和两封电子邮件,其中一封包含2000多个按键。

史密斯患有双相情感障碍,这是一种精神疾病,情绪和行为不断在两个极端之间摇摆。有些星期,他感到非常沮丧,以至于他几乎无法起床或完成日常生活的基本任务。然后,有些阶段他会感到非常欣快和精力充沛,他完成项目似乎不需要睡觉。

史密斯在他的智能手机上安装了一个程序,该程序记录他的所有活动,包括不仅是电话,还包括他的GPS和计步器读数,以及他何时使用哪些应用程序。这些信息会定期传输到服务器。史密斯正在参加由德累斯顿卡尔·古斯塔夫·卡鲁斯大学医院协调的一项研究。该项目名为Bipolife,其目标是改善双相情感障碍的诊断和治疗。研究人员计划对180名患者的智能手机进行为期两年的监控。

他们计划收集有关每位参与者精神状态的即时信息。此类数据应该很有用,因为双相情感障碍患者通常在即将出现抑郁或躁狂发作时没有意识到。这当然是史密斯的经历:“当我处于兴奋状态时,我会全身心地投入工作,睡三四个小时,然后在凌晨三点给教授们写邮件。我从来没有想到这可能不正常。我认识的每个人都羡慕我的精力和投入。”

这款智能手机应用程序旨在发出预警信号。“传输的数据会由计算机算法进行分析,”德累斯顿医院的心理学家埃丝特·米尔鲍尔解释说。例如,它可以识别参与者是否显著减少了电话通话,或者突然停止出门,又或者不分昼夜地工作,忽视睡眠。“如果我们的程序发现这种情况,它会自动向患者的精神科医生发送电子邮件,”米尔鲍尔说。然后,精神科医生会联系患者。

研究人员首先必须获得基线数据,例如,确定特定患者在无症状阶段如何使用手机。然后,软件会记录行为何时偏离患者的常态,以便可以快速进行治疗。史密斯认为这种监控非常令人安心:“这意味着总会有人关注我的病情,”他说。“这可能是一个重要的支持,特别是对于那些独居的人来说。”—F.L.

More to Explore

Computer-Based Personality Judgments Are More Accurate Than Those Made by Humans. Wu Youyou et al. in Proceedings of the National Academy of Sciences USA, Vol. 112, No. 4, pages 1036–1040; January 27, 2015.

Psychological Targeting as an Effective Approach to Digital Mass Persuasion. S. C. Matz et al. in Proceedings of the National Academy of Sciences USA, Vol. 114, No. 48, pages 12,714–12,719; November 28, 2017.

Language-Based Personality: A New Approach to Personality in a Digital World. Ryan L. Boyd and James W. Pennebaker in Current Opinion in Behavioral Sciences, Vol. 18, pages 63–68; December 2017.

The Data That Turned the World Upside Down. Hannes Grassegger and Mikael Krogerus in Motherboard. Published online January 28, 2017.

Deep Neural Networks Are More Accurate Than Humans at Detecting Sexual Orientation from Facial Images. Michal Kosinski and Yilun Wang in Journal of Personality and Social Psychology, Vol. 114, No. 2, pages 246–257; February 2018.

Predicting the Big 5 Personality Traits from Digital Footprints on Social Media: A Meta-Analysis. Danny Azucar et al. in Personality and Individual Differences, Vol. 124, pages 150–159; April 1, 2018.

Science journalist Frank Luerweg, age 50, fed a part of this article into Apply Magic Sauce. Its algorithm identified him as a 31-year-old, which he took as a compliment.

More by Frank Luerweg
© . All rights reserved.