本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定代表《大众科学》的观点
我已经有一段时间没有在这里写作了,因为最近我一直忙于一种非常不同的写作类型——完成我的博士论文。促使我回到博客世界的原因之一是我对最近第四频道节目《药物直播:迷魂药试验》的反应。
现在,我不会讨论在电视上服用非法药物的伦理问题,因为这个问题已经被充分讨论过了。相反,我想提请大家注意一个在某些人看来可能是一个很小的点,但我认为它代表了整个媒体科学报道中一个更大的问题。这篇文章比我通常的文章更广泛,但它与动物行为有关,动物行为作为媒体呈现的热门话题,经常以这种方式被误传。
首先,看看节目中的这张图表
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们今天世界的发现和想法的有影响力的故事的未来。
这似乎表明,人们在服用迷魂药(MDMA)后比没有服用时(对照组)投入了更多的钱(在计算机模拟的脸上),并且这种影响从一天增加到八天……但真的是这样吗?这张图表并没有告诉我们这一点。
我想说的是,为了展示这些柱状图之间是否真的存在差异,我们需要看到所谓的“误差线”。误差线是一种直观地显示您所做的测量值的变化程度的方法。例如,如果我站在牛津街拦住 1000 个人,问他们是否可以数数他们的手指,如果人们让我这样做,而不是在退缩之前奇怪地看着我,我可能会发现平均手指数量是 10 个(或者略低于 10 个,因为有人失去手指的可能性可能比多一个手指的可能性更大)。然而,我抽样的大多数人很可能都有 10 个手指。由于手指数量的这种微小变化,如果我在图表上绘制它,误差线就会很小。
另一方面(真的不是双关语),如果我在街上拦住另外 1000 个人,数数他们钱包里有多少没用的东西,我可能会发现平均值也是 10 个,但这次变化会大得多:很多整洁、有条理(或者我喜欢称之为反社会)的人会拥有零个没用的东西,而其他人可能会有几十张废纸、可以追溯到 20 世纪 80 年代的收据以及他们甚至不知道存在商店的奖励卡。这次的误差线会很大。
通过在图表上放置误差线,我们可以看到我们正在查看的数据中有多少变化,更重要的是,可以直观地评估不同组的平均值实际上彼此不同的可能性有多大。
例如,这张图表(我刚刚编造的数据)显示,男性比女性喝更多的啤酒(平均每周 20 杯而不是 15 杯;紫色柱状图)。然而,英国人并没有比美国人吃更多的馅饼(绿色柱状图)。即使平均数字相同(女性喝 15 杯啤酒,美国吃 15 个馅饼,男性喝 20 杯啤酒,英国吃 20 个馅饼),误差线告诉我们数据彼此之间非常不同。在吃馅饼的数量方面,数据变化很大,英国和美国的一些人吃的馅饼很少,而另一些人吃了很多,最有可能的是位于曼彻斯特的人。由于每个组(英国和美国)内的数据变化很大,我们无法确定平均值在英国比在美国更多的事实是否是真实的发现,还是仅仅是由于偶然性造成的。
回到“药物直播:迷魂药试验”,由于他们的任何图表上都没有误差线,我们无法确定我们看到的任何差异是否真的存在。简而言之,这些图表毫无意义。
在药物科学网站上,大卫·纳特、瓦尔·柯伦和罗宾·卡哈特-哈里斯写道,他们最初在图表上包括了误差线(和 p 值),但第四频道为了清晰起见删除了它们。这有点讽刺,因为这样做,他们无意中使结果更难解释。显然,第四频道认为,向普通观众解释会“很困难”。我认为第四频道不应该对他们的观众抱有偏见。人们喜欢被挑战,并发现起初可能不清楚的事情;这就是人们继续观看悬疑谋杀案的原因。即使该节目没有足够的时间来解释误差线是什么,我也不认为人们会发现图表在有误差线的情况下更难解释,甚至可能会导致人们去谷歌搜索并自己找出它们的用途。
我认为,让人们更容易了解科学过程越好,而做到这一点的最好方法是通过像这样的电视节目。作为一项既做了原创工作,又涉及许多人感兴趣的话题的研究,它似乎非常适合电视。我在这里的抱怨不是专门针对第四频道,而是针对更普遍的科学呈现方式。人们掌握越多关于实验如何设计、进行然后解释(使用统计作为工具)的工具,科学家和所有人(包括立法者)之间的沟通就会越好。
*********************************************************************************
如果您渴望了解误差线之外的更多统计信息,我前几天偶然发现了这个很棒的博客。