本文发表于《大众科学》的前博客网络,仅反映作者的观点,不一定反映《大众科学》的观点
约瑟夫·戈培尔曾说:“如果你说了一个足够大的谎言并不断重复它,人们最终会相信它。” 然而,在大数据时代,在机器学习的引导下,许多较小的谎言可能比少数弥天大谎更有效。 甚至用影射调味的字面真相也行。研究表明,陈述中突出的概念可以持续存在并支配其嵌入的字面真相。 例如,考虑以下陈述:“没有证据表明希拉里·克林顿在彗星披萨店外经营儿童性奴隶制。” 经常重复它,人们很容易只记住“希拉里·克林顿……儿童性奴隶制”的概念,而不是它的否定。
特朗普总统对真相的漠视通常显得是冲动的,而不是战略性的——有点像酒吧里的吹牛者(如果他不是一个禁酒主义者的话)。 当得知有关他的就职典礼人群不如奥巴马总统首次上任时的人群,甚至不如妇女大游行聚集的抗议人群时,特朗普愤怒地回应(并让他的新闻秘书坚持)他的就职典礼人群是美国历史上最多的(不是真的)。 在竞选期间,他声称看到新泽西市的人们在街上跳舞庆祝 9/11 袭击事件(也不是真的)。 选举结束后,他声称数百万非法移民的选票使他失去了普选票(没有证据)。
特朗普总统热情拥抱随意撒谎在一定程度上被视为“假新闻”普遍现象的反映和产物。“假新闻”的影响是真实存在的——华盛顿特区的彗星披萨店确实被许多人认为是儿童性交易团伙的所在地,该团伙在希拉里·克林顿的参与下运作。 12 月 4 日,那里发生了一起离奇的围攻事件,武装精良的埃德加·韦尔奇进入餐厅,并宣布他来此调查此事。 性奴隶的故事纯属虚构,但在互联网上铺天盖地。 埃德加·韦尔奇相信了它,并从北卡罗来纳州前往华盛顿特区,准备战斗。
关于支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。 通过购买订阅,您正在帮助确保未来能够继续报道关于发现和塑造我们当今世界的思想的具有影响力的故事。
假新闻从何而来? 事实证明,创建和传播假新闻是一项有利可图的家庭手工业。 NPR 追踪到一位假新闻创作者贾斯汀·科勒,他在洛杉矶郊区。 科勒最初迎合另类右翼,并在最近的总统竞选期间找到了迅速扩大的受众——“一个庞大的 Facebook 群体,由狂热的特朗普支持者组成,他们正等着吞噬这块红肉。”
贾斯汀·科勒是一位民主党人,他说他想揭露假新闻现象。 但收入很可观(每年超过 10 万美元),而且,最终,他希望人们做的是点击他的故事,以便他可以收取广告收入。
但是,假设您有兴趣让某人做一些比点击更多的事情呢? 一些政治性的事情——比如投票给特定的候选人、参加集会、给你的国会议员写信等等? 这就是大数据发挥作用的地方。
自 2004 年以来,政治顾问一直使用大数据模型来预测人们将如何投票,并表明是否应该向他们发送消息以鼓励他们这样做(如果是,则发送哪些消息)。 他们使用随机实验(A-B 测试)来确定不同消息在个人层面的效果,并将此与其他变量(如人口统计数据和投票数据)相关联,以构建预测模型。 所有这些都类似于营销领域发生的事情(例如,是否应向给定的消费者发送招揽 A 或 B),奥巴马总统是使用预测分析来定位个人选民的先驱。
自 2004 年以来,预测建模科学取得了长足的进步。统计学家现在构建“人格”模型,并将它们与其他预测变量联系起来。 现在可以根据埃德加·韦尔奇的人格分类(而非仅仅是其人口统计投票行为)来定向发送消息,人格分类来自大量可供购买的详细个人数据。 其中一个模型带有首字母缩写词“OCEAN”,代表开放性、尽责性、外向性、宜人性和神经质的人格特征(及其对立面)。 在个人层面使用大数据,机器学习方法可能会将一个人分类为,例如,“封闭、内向、神经质、不随和且尽责”。
剑桥分析公司(由特朗普的主要捐助者丽贝卡·默瑟所有)的首席执行官亚历山大·尼克斯表示,他掌握着关于您和每位其他选民的数千个数据点:您购买或借阅什么、您住在哪里、您订阅什么、您在社交媒体上发布什么等等。 在最近的康科迪亚峰会上,尼克斯以枪支权利为例,描述了如何根据您的人格概况专门为您定制消息。 您是否高度神经质且尽责? 尼克斯建议使用一只险恶的戴着手套的手伸过破窗的图像。
尼克斯在他的演讲中指出,目标是诱导行为,而不是交流思想。 那么真相在哪里呢? 斯坦福大学管理科学助理教授约翰·乌甘德认为,对于尼克斯和剑桥分析公司来说,真相并不重要。 在指导一位假设的私人海滩所有者如何阻止人们进入他的房产时,尼克斯避开了仅仅是事实的“私人海滩”标志,而是提倡一个谎言:“发现鲨鱼。” 乌甘德在他的评论中,告诫所有数据科学家不要“构建用于肆无忌惮地定位的工具”。
警告是必要的,但可能为时已晚。 尼克斯在他的演讲中描述的内容涉及针对他的目标人格精心制作的消息。 他的信息巧妙地牵动了各种心理弦索来操纵我们,并且它们不遵守真相的界限,但它们需要人类来创造它们。 下一个阶段将是用机器学习算法逐步取代人类的“工艺”,这些算法可以为目标选民提供源源不断的内容(来自任何来源,无论真假),旨在引出期望的行为。 大数据学术期刊意识到数据科学家已经打开的潘多拉魔盒,已为未来一期专门讨论“计算宣传”的期刊发出征稿启事。
希望它将解决更广泛的伦理和政策问题,而不是一本“操作指南”。