本月早些时候,视觉特效艺术家 托德·瓦兹里 提出一个观点,认为共和党总统候选人唐纳德·特朗普可能与竞选团队的代笔人共享他的 Twitter 账户。这一假设是基于 @realDonaldTrump 在该社交媒体平台上的语气和信息存在着奇怪的差异。根据瓦兹里的说法,特朗普很可能使用他的三星 Galaxy 安卓智能手机敲出了最具煽动性的微型博客信息,而语气较为缓和的推文则来自他的工作人员,他们使用的是自己的 iPhone。现在,一项定量分析已经证明他的观点是正确的。
数据科学家 大卫·罗宾逊 将瓦兹里的猜测(这既不是新鲜事,也不是非常令人震惊)视为一个绝佳的机会,可以测试他开发的新工具,来分析社交媒体帖子背后的情绪。在挖掘了 @realDonaldTrump 的近 1400 条信息后,罗宾逊证实,该账户的安卓和 iPhone 推文来自不同的人,他们在一天中的不同时间发布,并以不同的方式使用标签、链接和转发。他还发现,特朗普的安卓推文大多比其工作人员的 iPhone 推文更愤怒、更消极,而 iPhone 推文通常是良性的公告和图片。“我的目标是确定 iPhone 和安卓推文之间的差异,并看看托德·瓦兹里和其他人的怀疑是否可以得到定量支持,”罗宾逊说。他去年在普林斯顿大学获得了定量和计算生物学博士学位,现在为 Stack Overflow 工作,这是一个为计算机程序员提供问答的网站。
罗宾逊的工具是一种情感分析形式,它将快乐、悲伤或愤怒等情绪与自然语言样本联系起来。“我使用的方法是最简单的之一:计算与每种情绪相关的单词数量,”罗宾逊说。他使用了 NRC 词语-情感关联词典 将单词与情感匹配。该参考指南 将 “疯狂”、“愤怒” 和 “战斗” 等词与愤怒联系起来,而 “获胜” 和 “爱” 等词则表示喜悦。罗宾逊使用了他与 同事数据科学家朱莉娅·西尔格 开发的开源文本分析工具,自动计算和归因特朗普推文中的单词。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过 订阅来支持我们屡获殊荣的新闻报道。通过购买订阅,您正在帮助确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。
每一条非夸张的推文都来自 iPhone(他的工作人员)。
每一条夸张的推文都来自安卓(他本人)。pic.twitter.com/GWr6D8h5ed
— 托德·瓦兹里 (@tvaziri) 2016年8月6日
罗宾逊发现,特朗普本人使用的与厌恶、悲伤、恐惧、愤怒和其他负面情绪相关的词语数量几乎是其通过 iPhone 发送的推文的两倍。此外,iPhone 推文包含图片或链接的可能性高 38 倍,罗宾逊认为这是因为竞选团队有兴趣引起人们对重大事件的关注,并展现出某种程度的外交姿态,例如祝愿美国奥运代表队好运。另一个迹象是特朗普对 Twitter 的转发功能视而不见,而是倾向于复制和粘贴他想传播的推文,并将这些信息放在引号中,据罗宾逊说。“值得注意的是,iPhone 和安卓之间最显着的差异中,很多不是关于情绪,而是关于标签、照片、链接和转发的使用,”他说。“将这些结果与情感分析相结合,有助于更全面地了解 iPhone/安卓之间的差异。”
区分推文是来自 Twitter 的 iPhone 还是安卓手机应用程序本身并不是什么秘密。在 Twitter 上运行的每个应用程序都必须在开发人员平台上注册,并向该社交媒体网站标识自己。许多 Twitter 应用程序,例如 TweetDeck 和 Echofon(它们帮助人们组织每日的大量推文),也同样会标识用于发布特定信息的平台。
罗宾逊的分析将引起政治竞选以外的更广泛的兴趣,马萨诸塞理工学院 交互式机器人小组的博士后研究员 布拉德·海耶斯 说。海耶斯最广为人知的身份是 DeepDrumpf 的创建者,这是一个臭名昭著的 Twitter 机器人,通过模仿这位共和党总统候选人的用词和说话方式来生成虚假的唐纳德·特朗普推文。社交媒体帖子自动化的现象在名人和其他公众人物中很常见,他们发现很难满足填充新闻源的需求。“很自然地,像罗宾逊这样的分析将越来越受关注,以确定在线存在何时可能由其实际所有者控制,”海耶斯解释道。
情感分析在营销人员中也很受欢迎,他们使用这项技术来估计公众对特定品牌的情感。如果麦当劳想知道顾客对他们的产品与汉堡王或温蒂相比的感受,他们可能会下载数千条推文并检查内容中表达的情绪,据罗宾逊说。“这可以帮助他们的营销策略,例如,[通过]衡量他们客户最大的抱怨和[识别]他们最具威胁的竞争对手,”他说。
社交媒体审查也被用来试图预测经济趋势和股市表现,尽管结果 尚无定论。“情感分析是一种在特定情况下有用的非常具体的工具,但它不是魔术,”罗宾逊指出。