在线社会科学:网络能否从数字培养皿升级为虚拟实验室?

社会科学家邓肯·瓦茨谈到网络如何兑现其十年前的承诺,为研究人员提供前所未有的行为研究素材


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将有助于确保未来能够继续讲述关于塑造我们当今世界的发现和思想的具有影响力的故事。


在许多方面,互联网都是终极的虚拟实验室。社交媒体和新闻网站向随便的观察者展示了我们关注的重点和兴趣,无论是美国持续不断的“财政悬崖”政治谈判的严峻预后,还是对英国皇室怀孕的欢欣鼓舞。社会科学家认为,除了这些肤浅的表象之外,互联网还可以成为以空前的速度进行广泛而廉价的研究实验的工具。

邓肯·瓦茨十多年来一直在研究互联网对社会行为的影响,以及反之亦然。2001年,瓦茨和哥伦比亚大学的社会学家同事发表了他们的“小世界项目”的结果,这是一个电子邮件版本的社会学家斯坦利·米尔格拉姆1967年著名的“六度分隔”实验,该实验使用蜗牛邮件来测试地球上每个人与其他人之间都相隔大约六个人的链条的理论。2006年,瓦茨与一个研究团队合作进行了音乐实验室,这是一个在线实验,说明了预测一首歌曲在不同听众群体中受欢迎程度的难度。

现在,瓦茨是微软研究院纽约市办公室的首席研究员,他专注于改进基于互联网的研究方法,并寻找新的方法来更有效地利用网络作为众包知识的工具。一个月前袭击纽约市和美国东北部的超级风暴桑迪仍然历历在目,以及网络在协调应急响应和救灾工作中成功和不成功的方式也让他记忆犹新。

瓦茨说,网络可能对社会科学产生深远的影响,因为它提供了前所未有的机会,让人们愿意参与实验。他补充说,其中一个实验可能是测试紧急情况下众包信息的价值和准确性,以及指导网络用户在灾难发生时如何最好地协调他们的资源。

大众科学最近与瓦茨谈论了网络革命性地改变社会科学的能力,为什么为在线测试参与者支付更多钱并不能保证更准确的数据,以及如何在危机期间最大限度地利用众包来评估地面上发生的情况。

[以下是采访的编辑稿。]


您为什么对网络作为进行社会科学实验的工具如此感兴趣?
网络为社会科学提供了新的机会,因为它极大地改变了运行实验的成本结构、可以运行这些实验的规模和速度,以及您可以纳入受试者库的人员的多样性。

“小世界”和“音乐实验室”教会了您关于进行基于网络的社会科学研究的哪些知识?
“小世界”和“音乐实验室”是成功的,但在某些方面,它们也突出了在线进行实验的难度。一个优势是能够招募成千上万的人参与。支付那么多参与者的费用将是令人望而却步的,因此,实际上,我们不得不“游戏化”我们的实验,使其具有吸引力。这种方法导致了权衡。一方面,通过使研究对参与者来说有趣且具有吸引力,我们以非常低的成本进行了一些非常大的实验。但最有趣的研究问题不一定适合有趣、引人入胜的游戏,而反过来,大多数有趣的游戏都太复杂,无法适应来自理论的清晰假设。另一个问题是,在线运行实验也会遇到与抽样和测量有关的某些方法论问题。我真的认为我们正处于所有这些虚拟实验室式实验的中间阶段。

亚马逊的 Mechanical Turk数字劳务市场(2005年推出)如何影响了在线研究?
Mechanical Turk的伟大之处在于,大多数任务都非常枯燥,所以我们不必太担心让我们的实验变得有趣,或者像游戏一样,因为也许我们毕竟可以支付参与者报酬,即使我们只需要支付他们一点点报酬。

几年前,与我的[前] 雅虎同事温特·梅森合作,我们演示了如何使用 Mechanical Turk 进行行为研究,并使研究人员更容易从亚马逊的平台中受益(pdf)。我们研究了经济激励对参与者表现的影响。如果你付给人们更多的钱去做某项工作,这会如何影响他们的表现?[问题中的任务要求参与者将一组以两秒间隔从交通摄像头拍摄的图像按时间顺序排列。] 我们发现,增加报酬会增加他们完成的工作量,但根本不会提高他们的表现质量。事实上,它主要增加的是他们认为自己应该得到多少报酬!

听起来网络似乎是为用作研究环境量身定制的。它缺少什么?
我们不断发现,在线运行实验的最大挑战不是数据库或用户界面或用于设计网络的算法。所有这些都很简单明了。困难的部分实际上是以可靠的方式招募人员。我们向前推进的许多想法是如何建立更好的基础设施,以透明且符合知情同意的通常原则的方式招募和跟踪人员。

这听起来像是您在更传统的社会科学实验中也会遇到的挑战。网络难道不是让招募参与者更容易了吗?
在过去的几个实验中,我们招募了 100 人,并在不同的研究中一次使用了大约 20 或 30 人。但是,在六个月或一年后,当我们进行下一个实验时,过去实验中的所有人都已经离开了,因为 Mechanical Turk 领域的人员流动性很大。
实际上,这在实验心理学和行为经济学的历史上是很典型的——你为你自己的实验招募了一群人,他们进来参与,然后他们离开,你就再也听不到他们的消息了。

您如何使用 Mechanical Turk 和其他网络工具来改善这种情况?
我们希望建立更持久的受试者库,或者我们称之为在线研究受试者小组。一个想法是向他们支付保留费,以便他们在我们需要他们进行实验时可用。然后您可以随时向他们发送参与请求,尽管他们没有义务参与。这样做的好处是——我们可以预先指定我们对特定类型的人感兴趣,而不是像我们目前所做的那样抓住碰巧在附近的人。这似乎是一件显而易见的事情,但它需要构建一点基础设施,以便您可以提出这类问题。一旦您创建了这些在线小组,并且他们参加了许多实验,您就可以创建自定义样本,不仅基于他们的人口统计信息,还基于他们在过去实验中的行为方式。

除了改进研究方法外,网络如何用于及时交付有意义的研究结果?
我对集体解决问题感兴趣——即人群,甚至组织群体,如何解决复杂问题。我特别感兴趣的一个例子是对危机情况(例如自然灾害)的响应。当然,这是及时的,因为在纽约桑迪飓风过后,您有一整套组织——纽约警察局和消防局等地方机构,以及联邦紧急事务管理局和美国红十字会等国家机构——蜂拥而至试图提供帮助。灾难发生后,您立即面临着关于地面上正在发生的事情的大量不确定性问题。急救人员通常积极性很高且善意,甚至可能在之前的灾难中有很多经验,但危机情况也有一种不同于过去的意外方式,因此您总是会遇到没有人确切知道谁需要什么、相关资源位于何处或如何协调救援工作的情况。

最近,一些志愿者“危机地图绘制”组织,例如待命工作队 [SBTF],已经开始通过实时监控 Facebook、Twitter 和其他社交媒体、新闻报道等信息来源,然后将这些报告叠加在地图界面上,从而在危机情况下发挥作用,救援机构和受影响人群都可以使用该界面来提高他们对情况的理解。他们的努力确实令人鼓舞,他们从经验中吸取了很多教训。我们希望通过基于网络的危机响应演习来构建基于现实世界模型的模型,这些演习测试在灾难期间和之后进行沟通和协调资源的最佳方法。

您将如何改进现有的危机地图绘制工作?
这些危机地图绘制者的努力确实令人鼓舞,像 SBTF 这样的组织已经从艰苦的经验中学到了很多关于如何更有效地运作的知识。与此同时,他们也遇到了他们模型的某些局限性,他们的模型严重依赖于相对较少的敬业人士,他们很容易不堪重负或精疲力竭。我们希望通过以更科学的方式理解如何在不使系统任何部分过载的情况下扩大像 SBTF 这样的信息处理组织,来帮助他们。

您将如何在您一直描述的这种虚拟实验室环境中做到这一点?
基本思想是将多组受试者放入模拟的危机地图绘制演习中,系统地改变不同的组织方式,并测量他们集体处理相应信息的速度和准确性。因此,对于任何给定的演习,组织者都会创建一个特定的灾难场景,包括倒塌的电线、倒下的树木、火灾和被洪水淹没的街道和房屋。然后,模拟将生成信息流,例如实时推文流,类似于真实事件中发生的地面报告类型,但以可控的方式进行。

作为此演习的参与者,假设您正在监控 Twitter 提要或其他报告流,而您的工作是尝试根据您正在阅读的内容准确地重新创建组织者的灾难地图。例如,您正在查看飓风桑迪期间与“#sandy”相关的所有内容的 Twitter 提要。从这些信息中,您想要构建一张纽约和三州地区的地图,该地图显示所有停电的地方、所有倒下的树木的地方、所有发生火灾的地方。

您当然可以尝试自己做这件事,但随着信息流速度的增加,任何一个人都会不堪重负;因此,有必要让一群人一起工作。但是,根据小组的组织方式,您可以想象他们会做得更好或更差。然后,实验的目标将是衡量不同类型的组织(例如,具有不同的劳动分工或不同的管理层级)的绩效,并发现哪些组织在您呈现的场景复杂性和信息生成速率的函数关系中表现更好。这是我们现在正在努力构建的东西。

实施此类众包灾难地图绘制演习的时间框架是什么?
我们离做成这样的事情还有几个月的时间。我们仍然需要设置后勤保障,并正在与一位从事危机地图绘制的同事交谈,以更好地了解他们是如何做事的,以便我们可以以现实问题为动力来设计实验。

您如何知道您的实验何时为更好地管理灾难响应创造了有价值的东西?
没有理论说,这是组织 n 个人以可靠地处理最大信息量的最佳方式。因此,理想情况下,我们希望设计一个足够接近现实危机地图绘制场景的实验,以便它可以产生一些可操作的见解。但该实验还需要足够简单和抽象,以便我们了解一些关于人群如何处理信息的知识,这些知识可以推广到危机地图绘制的非常具体的情况之外。

作为一名科学家,我想以一种清晰、简洁的方式识别因果机制,并将问题简化到本质。但作为一名关心在现实世界中有所作为的人,我也希望能够回到我那位危机地图绘制的朋友身边,并说我们做了实验,这就是科学告诉您应该做的事情,以便更有效率。

© . All rights reserved.