Sep Kamvar 是斯坦福大学计算数学的咨询教授,也是一位专门从事数据挖掘的计算机科学家。他还是与艺术家 Jonathan Harris 共同创立的知名网站 “We Feel Fine” 的联合创始人,该网站梳理博客中表达的情绪,然后以鲜艳的色彩群显示结果。该网站提供了一种探索我们共享虚拟世界的情感轮廓的方式,并吸引了心理学家和其他科学家的兴趣。现在,两人已将该网站最有趣——且视觉上最引人注目——的发现汇编成一本书,《We Feel Fine:人类情感年鉴》。Kamvar 与《Mind Matters》编辑 Gareth Cook 谈论了该项目及其对心理学的潜在价值。
COOK:请描述一下 “We Feel Fine” 网站的外观?
KAMVAR:“We Feel Fine” 网站是一个交互式可视化工具,展示了一个持续更新的数据库,其中包含博客上超过 1300 万种情绪表达。该网站本身有 6 种不同的动态效果,每种效果都围绕一系列彩色点构建。 每个彩色点都是一个情感句子的视觉表示。它们根据情感进行着色,当用户点击一个点时,球会爆炸并显示句子。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保未来能够继续发布关于塑造我们当今世界的发现和思想的具有影响力的报道。
COOK:您能举个例子吗?
KAMVAR:开场动态效果是一个有趣的视觉呈现,我们称之为“疯狂”。在“疯狂”中,所有彩色点都在屏幕上疯狂地涌动,当您点击其中任何一个点时,它会爆炸,显示其背后的情感句子。另一个动态效果称为“群体”,其中点会聚在一起形成条形图,以显示有关数据集的一些基本统计信息,例如,最常见的情感是什么?
COOK:它是如何工作的?
KAMVAR:“We Feel Fine” 的核心是一个爬虫,它每隔几分钟就会扫描博客圈,并搜索“I feel”或“I am feeling”这两个词。 这些数据来自各种来源,包括 LiveJournal、MySpace、Blogger、Flickr、Twitter 和 Google。
一旦找到 “I feel” 或 “I am feeling” 这两个词,系统就会回溯到句子的开头,并向前延伸到句子的结尾,并将完整的句子存储在数据库中。
由于博客的结构在很大程度上是标准化的,因此爬虫可以使用博客的“个人资料”部分来获取撰写句子的博主的 demographic 人口统计信息(年龄、性别、位置),这些信息与情感一起存储在数据库中。
COOK:您什么时候第一次清楚地意识到这些数据可能具有一定的科学价值?
KAMVAR:一旦我们的数据库中有了数百万种情感,我们就意识到这可能是现存最大的情感数据库。它使我们能够在几秒钟内对数十万人进行“调查”。我们认为这将是假设生成的一个很好的工具,可以围绕以下问题提出假设:人们在冬天会感到更悲伤吗?男人和女人的感受有何不同。
COOK:您能描述一个使用过这些数据的科学项目吗?
KAMVAR:我们与宾夕法尼亚大学的 Cassie Mogilner 和斯坦福大学的 Jennifer Aaker 进行了一些有趣的合作。Cassie 和 Jennifer 的研究重点是幸福感,在本研究中,我们感兴趣的是人们如何定义幸福感。我们使用了 “We Feel Fine” 和其他更传统的方法来表明,随着年龄的增长,幸福感的含义会以非常具体的方式发生变化。
COOK:他们发现了什么?
KAMVAR:在 “We Feel Fine” 数据库中,与“快乐”这种情感在同一句子中共同出现的情感发生了明显变化。 对于年轻人来说,与快乐最常共同出现的情感是兴奋,而对于老年人来说,与快乐最常共同出现的情感是平静。
然后,Cassie 领导了许多实验,我们在这些实验中使用了不同的方法来以不同的方式研究这种现象。 例如,我们通过为人们播放同一首歌的慢速原声版本或快速电子版本来影响他们感受兴奋或平静。 然后,我们给他们做了一个调查,其中一个问题要求他们评价自己的幸福感。
受到平静感影响的老年人比受到兴奋感影响的老年人更快乐,而受到兴奋感影响的年轻人比受到平静感影响的年轻人更快乐。
COOK:还有谁联系过您,希望使用这些数据进行科学研究?
KAMVAR:Peter Dodds 和 Chris Danforth 是佛蒙特大学应用数学系的两位教授。 他们在几年前与我们联系,希望使用该数据集,最近在《幸福研究杂志》上发表了一篇论文,题为《衡量大规模书面表达的幸福感》。
COOK:他们发现了什么?
KAMVAR:Christopher 和 Peter 从一个名为“英语词汇情感规范 (ANEW)”的数据库中提取了单词的标准化效价得分。 他们使用这些得分来为 “We Feel Fine” 数据库中的每个句子分配一个幸福感得分。 他们使用这个得分来确定数据中的趋势,例如,迈克尔·杰克逊的去世是过去几年博客圈中最悲伤的日子之一。
COOK:请您简单介绍一下这本书。您认为书中有什么内容可能会引起研究人员的兴趣并进行跟进吗?
KAMVAR:这本书讲述了我们在数据集中发现的两种类型的故事,我们称之为微观故事和宏观故事。 微观故事是关于个人及其情感的个别故事。 宏观故事是大型统计数据(例如,幸福感的性别构成,或与兴奋感共同出现的最常见情感)。
宏观故事都是进一步研究的非常有趣的种子。 例如,我们发现感恩和幸福之间存在很强的联系,另一方面,兴奋和焦虑之间也存在很强的联系。 或者我们发现,人们随着年龄的增长会变得更快乐,并且在青少年时期之后,幸福感会大幅上升。
我们记录了人们在不同天气条件、围绕不同主题(如人际关系或家庭)、不同年龄段、不同地理位置等方面的各种情感差异。 所有这些都为进一步研究提供了素材。
COOK:这似乎是一种新的心理学研究方法。您认为这种方法的潜在优势和劣势是什么?
KAMVAR:规模和成本可能是该方法论的两个最大优势。使用这样的数据集,可以在不到一分钟的时间内对 200 万人进行实验。缺点是确实存在人口偏差,并且只能进行某些类型的实验。例如,我们无法像在实验室中那样,进行改变环境条件、测量情绪反应并将其与对照条件进行比较的实验。可以使用 “We Feel Fine” 进行的实验类型主要是大规模相关性实验。
我认为计算心理学的方法将成为传统心理学方法的有益补充。 它们擅长快速生成假设,而这些假设可以使用实验心理学中更成熟的方法进行检验。
COOK:您是否惊讶地发现自己正在担任兼职大众心理学家?
KAMVAR:我是一名受过训练的计算机科学家,白天我在斯坦福大学教书和做研究。 我之所以涉足这个领域,是因为我认为网络上最有趣的转变之一不是技术转变,而是随之而来的文化转变,人们现在可以放心地在网上分享自己的整个生活。 这种文化转变为科学家、艺术家和技术专家带来了许多机会。
回顾起来,我的工作朝着现在的方向发展确实令人惊讶——但这真是一段非常有趣的旅程!
您是科学家吗?您最近是否读过一篇您想撰写的同行评审论文?那么请联系《Mind Matters》的联合编辑 Gareth Cook,他是一位在《波士顿环球报》获得 普利策奖 的记者,他在那里编辑 周日观点 版块。您可以通过 garethideas AT gmail.com 与他联系