如何更好地拥抱未知

如何解读常见数据可视化形式中的不确定性

杰西卡·赫尔曼和珍·克里斯蒂安森

在追踪飓风时,预报员经常会展示一张地图,上面描绘着“不确定性锥体”。它最初是一个点——飓风当前的位置——然后扩展成一片风暴未来几天可能经过的区域。最可能的路径是沿着锥体的中心线,概率向边缘递减。问题是:许多人误解了锥体是未来风暴的大小。

研究人员发现,如果预报员改为展示许多可能的路径,就可以防止这种误解。然而,这种方法也可能引入误解:许多人认为,每条路径与陆地相交的地方发生破坏的可能性更大,而在线条之间则可能性较小(地图)。

图片来源:蒂芙尼·法兰特-冈萨雷斯;资料来源:国家飓风中心(不确定性锥体);Le Liu 等人在《IEEE 可视化与计算机图形学汇刊》第 25 卷,2018 年 8 月 20 日发表的“可视化热带气旋预测不确定性的方法:使用来自预测轨迹集合的代表性样本”(多条风暴路径


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


不确定性渗透到科学家和各种组织用来为决策提供信息的数据中。信息的视觉呈现可以帮助澄清不确定性,或者加剧混乱。理想情况下,可视化有助于我们对不同结果的可能性做出分析和情感上的判断。然而,关于人类推理的大量证据表明,当人们被要求做出涉及概率的判断时,他们往往会忽视不确定性。随着社会越来越依赖数据,图形设计师们正在努力寻找最佳方式来清晰地展示不确定性。

以下是一个展示不确定性的可视化技术图库,大致按照从效果较差到效果较好的顺序组织。了解如何选择和实施不同的方法可以帮助我们成为更精明的消费者,理解数据及其所涉及的不确定性。

不量化

呈现不确定性的最无效方法是不显示它。有时,数据设计师试图通过选择一种暗示一定程度不精确性但不量化的技术来弥补缺乏明确不确定性的不足。例如,设计师可能会将数据映射到一个人们难以定义的视觉变量,例如漂浮在空间中的圆形(顶部),而不是图形上具有 x 轴和 y 轴的点。这种方法使读者的解读更容易出错。或者,设计师可能会使用创建手绘或“草图”感觉的程序(底部)。这两种方法都存在风险。

图片来源:杰西卡·赫尔曼和珍·克里斯蒂安森

区间

区间可能是量化不确定性的最常见表示形式。误差线(顶部)和置信区间(底部)被广泛认可,但即使它们看起来精确而直接,也很难正确解读。研究表明,它们经常被误解,即使是科学家也是如此。

图片来源:杰西卡·赫尔曼和珍·克里斯蒂安森

概率密度图

设计师可以将不确定性直接映射到可视化的视觉属性。例如,渐变(顶部)图可以从中心深色(高概率)过渡到边缘浅色(低概率)。在小提琴图(底部)中,较宽的点表示较高的概率。与区间方法(误差线和置信区间)相比,将概率密度映射到视觉变量可以更详细地显示不确定性,但其有效性取决于读者感知阴影、高度或其他视觉属性差异的能力。

图片来源:杰西卡·赫尔曼和珍·克里斯蒂安森

图标阵列

将诸如 30% 这样的概率重新定义为频率——十分之三——可以使人们更容易理解不确定性,从而适当地使用此类信息。人们可能更容易理解离散概率,因为他们在日常生活中会遇到它们。

图片来源:杰西卡·赫尔曼和珍·克里斯蒂安森

空间中的多个样本

空间中多个样本的绘图可用于以离散格式显示一个或多个变量数量的概率。这种方法的一个例子是分位数点图。它显示了数据分布分位数的许多不同情况,因此点的数量(例如,在下面的示例中,两个点高或五个点高)传达了概率。当参数值(例如初始条件)的不确定性导致估计值不确定时,可以生成变化这些参数的样本,并在单个可视化中显示。

图片来源:杰西卡·赫尔曼和珍·克里斯蒂安森

时间上的多个样本

将多个可能的结果绘制为动画中的帧,使不确定性变得直观且更难忽视。这种称为假设结果图的技术可用于简单和复杂的可视化。感知研究表明,人们非常擅长从事件发生的频率中推断数据分布:我们不一定需要计算事件发生的次数来估计其概率。一个重要的因素是事件的速度,它必须足够快,以便人们可以看到足够多的样本,但又足够慢,以便他们有意识地记录他们所看到的内容。

图片来源:蒂芙尼·法兰特-冈萨雷斯(选举针),杰西卡·赫尔曼和珍·克里斯蒂安森(图表

混合方法

设计师可以通过组合不同的技术而不是选择标准的图表“类型”来创建有效的不确定性可视化。一个例子是扇形图,因英格兰银行而闻名(如图所示)。它描述了截至目前的数据(虚线的左侧),然后是未来预测;过去的不确定性是评估未来不确定性的重要组成部分(右侧)。扇形图以多个波段呈现概率,从较高概率(深色阴影)到较低概率(浅色阴影),读者可以从中选择不同的置信度级别。读者可以通过波段边缘的位置以及明暗程度来感知信息。一些用于统计图形和建模的现代软件包可以轻松地组合不确定性可视化方法。

图片来源:珍·克里斯蒂安森 资料来源:《通货膨胀报告》,英格兰银行,2010 年 2 月

© . All rights reserved.