本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定代表《大众科学》的观点
公民科学——涉及专业科学家和热情的业余爱好者团队之间合作的项目——如今非常盛行。这对对科学感兴趣的普通人来说很棒,他们现在不仅可以阅读有关科学的文章,还可以参与其中。这对科学家来说也很棒,像Zooniverse和Foldit这样的项目都取得了巨大的成功。公民科学对科学写作也很有利,因为读者可以真正参与到故事中。
然而,公民科学的蓬勃发展并未对所有科学学科做出同等贡献,动物学和天文学的项目很多,而物理学和心理科学的项目较少。粒子物理学领域很少有公民科学项目也许并不奇怪(没多少人在后院有加速器!),但是心理学领域几乎没有公民科学项目,这可能更值得注意。
认知科学家们并非不了解互联网。事实上,我们是最早将互联网用于研究的人之一,早在 90 年代初就在网上发布实验和调查问卷。到目前为止,已经有成百上千篇论文使用在线收集的数据发表。这种数据洪流导致了许多发现。例如,通过测试各个年龄段的数千人,研究人员在拼凑如何随着年龄的增长,大脑发生变化方面取得了快速进展。在线测试使研究人员更容易与遥远的人群合作,例如,使我们能够更好地理解语言之间的相似之处和差异。目前,我正在剑桥的办公室里舒适地进行韩语和俄语研究。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过 订阅来支持我们屡获殊荣的新闻报道。通过购买订阅,您正在帮助确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。
虽然互联网实验室确实代表了一种公民科学——它们向任何想作为研究对象参与的人开放实验室——但它们没有提供作为研究者而不仅仅是研究对象参与的机会。部分问题是方法论上的:对于许多项目,我们担心知道假设可能会影响人们的反应。部分问题可能只是习惯:我们习惯于将普通人视为可能的参与者,而不是合作者。
然而,在过去的几年里,包括我自己在内的几个研究小组找到了将公民科学纳入我们对人类大脑研究的方法。
词语的含义
VerbCorner——我自己的项目——专注于确定词语的含义。您可能会认为这是一个已经解决的问题:只需在字典中查找即可!但是,字典的问题在于它们使用其他词语来定义词语,而这些词语本身又使用其他词语来定义,如此循环往复,没有尽头。如果你不懂斯瓦希里语,斯瓦希里语词典对你没有太大帮助。同时,你可能会担心词语最终是不可定义的,因为它们的含义取决于上下文:我们谈论的是幼儿园学生、篮球运动员还是故事,高的含义是不同的。这是事实,但在某种意义上这是一个正交的点:人类显然知道词语的含义是什么,无论这些含义是精确的还是模糊的。科学家的工作是确定人类知道什么以及我们如何知道它。
阻碍这方面研究的不是使用韦氏或牛津字典,也不是决定含义是精确的还是模糊的——尽管这肯定是其中的一部分——而是问题的范围太大。仅英语就有很多词语。因此,即使一个人对词语含义有很好的理论,一位有进取心的科学家也需要很长时间才能遍历每个词语并根据该理论对其进行描述。然而,对于一支庞大的科学家团队来说,这个项目是非常可行的,而这正是公民科学发挥作用的地方。
在VerbCorner项目中,志愿者研究人员帮助根据一种词语含义的主流理论来描述动词,该理论由语言学家Beth Levin和Ray Jackendoff以及心理学家Steven Pinker等人推广。根据这个理论,许多词语(尤其是动词)的含义可以分为“核心”含义和含义的外围方面。动词的核心组成部分包括该动词描述的是有意为之的动作(约翰打了墙),还是意外的动作(约翰被木头绊倒),或者该动作是否需要身体接触(莎莉拥抱了玛丽),还是不需要(莎莉问候了玛丽)。有趣的是,这些含义的核心部分与发展心理学家认为婴儿最早理解的概念(意图、接触等)有很大程度的重叠。相比之下,还有一些特质的、非核心的含义,例如跑步和走路的物理差异。
我们的专业研究团队为核心含义的不同组成部分设计了直观的测试。在 VerbCorner 网站上,业余科学家可以帮助遍历英语动词,并确定每个词语是否包含该含义组成部分。为了使任务更具吸引力,该网站游戏化了,为每个任务设置了徽章、积分和奇幻的背景故事。但真正的奖励是科学。
词语记忆
Small World of Words(鲁汶大学)也专注于词语,但更多地关注词语在头脑中是如何表示和存储的,而不是它们的含义本身。公民科学家会看到一系列词语,例如气候、音高或银行。对于每个词语,他们被要求想到首先想到的其他三个词语。通过这一点,科学家们将能够以前所未有的方式研究词语之间的关联。以前的工作往往依赖于少量词语的小型研究,或者使用从网络挖掘的数据的词库,例如谷歌图书 Ngrams 项目——这些数据很有用,但充其量只是我们所关心的事物(即人们的实际想法)的不完善估计。
这些数据有很多用途。在技术方面,研究人员有兴趣使用这些数据来了解词语在记忆中是如何存储的。我们还可以使用这些数据来研究人们将哪些概念与哪些其他概念联系起来:这些联系会随着时间的推移或跨文化而改变。例如,20 年前,大多数人对气候的第一反应是天气。现在,大约 40% 的人说变化。美国人对音高最常见的联想是棒球,而英国人则是足球。
同样,这些数据不仅能让我们找出同一个词的不同含义:银行与金钱和河流相关联,而两者彼此之间没有关联。当然,这可以在字典中查找。无法查找的是哪个含义是主要的含义。正如您可以在这个图表中看到的那样,我使用 Small World of Words 的精彩可视化工具制作了这个图表,“金融机构”的含义远比“河边”的含义更突出。(这些工具非常有趣,但如果您计划参与该项目,请在过多浏览可视化工具之前进行。)
到目前为止,该项目已经处理了 7,000 个词语,还有更多词语正在添加。还有一个稍微旧一点的荷兰语项目,该项目已经处理了 12,000 个词语,并已经发表了几篇出版物,并且正在制作西班牙语、日语和普通话项目。
笑声的起源
笑声的起源早于人类。其他大型类人猿会笑,其他一些动物也可能会笑。婴儿笑声项目(伦敦大学)着眼于笑声的发展起源:是什么让婴儿发笑,为什么?从表面上看,婴儿发笑的原因与成人非常不同:婴儿很少觉得科尔伯特报告或周六夜现场那么有趣。
婴儿笑声项目背后的研究人员正在邀请公民科学家帮助编目婴儿笑声的各种原因。有年幼孩子的父母可以填写一份关于他们孩子笑声的调查问卷,任何听到他们认识的婴儿笑声的人都可以提交一份现场报告,描述婴儿发笑的时间、地点和原因。此外,尽管这似乎没有任何科学目的,但他们运行了一个婴儿笑声的视频博客,其中包括这个似乎正在做非常有趣的梦的视频。
正如该项目背后的研究人员之一卡斯珀·阿迪曼在这次采访中解释的那样,婴儿发笑的原因在一定程度上取决于他们对世界的理解。他们觉得什么令人惊讶或不寻常?因此,跟踪婴儿笑声的背景为研究婴儿发育中的大脑提供了一个新的窗口。
心理学公民科学的未来
如果这些项目成功,它们有可能对该领域产生巨大的影响,无论是直接的还是通过启发其他项目,就像人工智能领域所发生的那样。最早的此类项目之一,由麻省理工学院媒体实验室的 Open Mind 于 1999 年启动,它利用互联网志愿者来编译一个庞大的常识事实数据库(“外套用来保暖”,“太阳非常热”,以及“你做晚餐时最后做的事情是洗碗”),以训练计算机。由此产生的资源——以 ConceptNet 的形式发布——已被用于数百个人工智能项目中,包括从 推理 到解释 幽默 或 情感分析 的各种方面。最近,路易斯·冯·安 (Lous von Ahn) 利用游戏来引导志愿者帮助标记图像、数字化文本和识别歌曲,从而产生了大量用于各种人工智能项目的数据集。当前人们仍然可以参与的人工智能项目包括 Phrase Detectives (埃塞克斯大学)和 Wordrobe (格罗宁根大学),这两个项目都专注于创建资源来帮助计算机理解语言。
以上介绍的所有三个项目都已发表了基于初步结果的论文(例如,这里、这里 和 这里)。与思维相关的公民科学项目的未来看起来一片光明。