本文发表于《大众科学》的前博客网络,仅反映作者的观点,不一定代表《大众科学》的观点。
科学家们向您提供所有数据,希望您能比他们更聪明
那么你想成为一名科学家吗?你的机会来了。我们将发布有史以来收集的关于我们皮肤微生物的最大数据集之一。我们现在就要发布它,在发布之前。我们发布它是为了让您——在那里的那个人,无论“那里”在哪里——都能提出新的假设甚至分析。我们发布它是因为我们认为,从整体上来说,您比我们聪明得多。
图片 1. 是时候展现你内在的罗丹了。嘿,他是在看自己的肚脐吗?(图片来源:维基共享资源)
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻事业: 订阅。通过购买订阅,您将帮助确保未来继续有关于塑造我们当今世界的发现和思想的具有影响力的报道。
我们在这里提供的是一种新的方法,一种可能失败但值得尝试的方法。当我们在学校学习科学时,我们通常学习进行科学研究的“标准方法”。在标准方法中,有四个步骤……
步骤 1 - 科学家首先提出假设,或可以检验的想法。历史告诉我们,假设来源于与朋友的对话、已发表的论文、生存危机、精神闪电或钓鱼之旅。
步骤 2 - 然后设计实验或观察来检验这些假设。实验的设计应力求完美地检验假设,并考虑到每一种可能的意外情况。成本不是障碍。
步骤 3 - 项目设计完成后,科学家收集数据。即使科学家感到厌烦,也必须收集数据。即使科学家对完全不同的事物产生兴趣,也必须收集数据。必须不断收集数据,直到科学家变得脾气暴躁、 disillusion 或 forlorn。
步骤 4 - 数据收集完成后,科学家必须避免猜测数据所显示的内容,并等待分析的执行。统计分析用于排除每一个糟糕且不严谨的假设,直到只剩下一个最接近真相的假设。但真相永远不是完全的真相。因此,在遇到看似真实的事物时,人们会提出更多的假设,并重复整个过程,直到退休或直到宇宙中的一切都被理解,以先到者为准。
这确实是科学。提醒学生这些步骤的教科书是正确的,但它们只说对了一部分。科学也可以用许多其他方式来完成。例如,没有两位诺贝尔奖获得者以完全相同的方式进行科学研究,其他人也是如此。即使在我自己相对较小的生物学系,科学家们也以许多不同的方式进行科学研究(这也是我们在招聘新同事时,有时会对哪个候选人优秀,哪个候选人糟糕意见不一致的原因之一)。我在曾经工作或访问过的每个部门都是如此。科学方法有很多种,成功的规则例外情况也很多。
我长期以来一直感兴趣的例外之一是,究竟是谁真正执行了这一(或任何)科学过程中的每个步骤。基本上,自科学起源以来,科学家们就说服其他人为他们收集数据。
当收集数据的人是无偿的并且正在上课时,我们称他们为学生。当他们收入微薄且不上课时,我们称他们为技术员。当他们完全无偿并且还有日常工作时,我们称他们为公民科学家或志愿者。问题越大(或者科学家在非科学职责上越忙),这些数据收集者的作用就越重要。
当然,在每种情况下都有好处。对于学生来说,收集数据是通往设计自己的项目和发展自己的假设的入门途径。对于公民来说,收集数据使他们能够成为更大的科学事业的一部分,并且作为更大事物中的个体,他们通常不会感到收集所有数据的完全乏味。至于技术人员,嗯,祝福他们。
有趣的是,虽然科学家动员其他人参与数据收集有着悠久的历史,但在科学的其他步骤中,公众参与的历史却要少得多。这些其他步骤包括我认为几乎无可辩驳地是最有趣的科学部分:提出假设和分析哪些假设可以被拒绝。有趣的是,这是科学过程中个人科学家似乎最有可能需要帮助的两个步骤。在我们最近对皮肤细菌的研究中,情况确实如此。
正如我几天前提到的,我们一直在努力解释个体人类之间皮肤上细菌的差异。每个人的皮肤都覆盖着细菌(没有皮肤细菌永远不是一种选择,你被生命包裹着,无论你是否喜欢),问题仅仅是我们有哪些细菌以及为什么。我们已经提出了一些假设,这些假设可能解释特定人身上细菌的数量和种类。我们认为性别可能很重要,年龄也很重要,或者一个人的肚脐是内凹还是外凸也很重要。
使用我们最初的 60 人数据集,我们测试了许多这些假设,但到目前为止,这些假设似乎都没有得到数据的支持(有人可能会说它们都被拒绝了,但只有 60 个人,被拒绝的假设可能只是我们数据太少而无法检验的假设)。现在我们有了一个更大的数据集。该数据集包括来自世界各地的 150 多个肚脐。
我们现在想做的是征求您(无偿的)帮助来生成假设。令人惊讶的是,这已经认真开始了。我每天都会收到大约十个新的假设的电子邮件,我喜欢它们!请将您的想法添加到列表中。但我们也希望征求您的帮助来分析数据并可视化正在发生的事情。请贡献您深夜的想法,以及您的分析和艺术技能。
事实上,我们在我们的网站(http://bbdata.yourwildlife.org/)上创建了一个新的空间,供您分享您的想法并展示您的才华。在那里您还可以找到一个可下载的数据文件。它包括与研究中每个人相关的数据(除了他们的姓名和其他标识符),以及关于在其肚脐中发现的物种的数据(技术上是 OTU,或操作分类单元,仅基于我们发现的生物的基因)。
我们不确定当我们公开这些数据进行公众分析时会发生什么。在传统的科学方法中,尚不清楚我们是否可以(或如何)在科学期刊上发表这些数据的最佳分析结果。期刊的构建方式不允许我们在这里所做的事情。但也许这并不重要。毕竟,我们也为自己节省了一些有趣的科学部分。您看,在接下来的几个月里,我们将获得来自北美各地另外四百人的数据。当这些数据到位后,我们可以跟进这里出现的任何假设和分析。换句话说,我们可以根据您弄清楚的任何内容重新开始科学过程。
就这样,我们把它留给您了——思想的火花、可视化的艺术和精细分析的清晰度。公民科学家常常被给予残羹剩饭来处理,即难以分类的样本。我们正在给您好的东西,以便您也可以参与到乐趣中来。唯一的问题是您是否会参与,好吧,还有肚脐里的奥秘到底是怎么回事。