2018年,当飓风弗洛伦斯和迈克尔接连威胁到我居住和工作的北卡罗来纳州教堂山时,我和数百万人一样面临一个简单的二元决定:留下还是离开?
如今,数据科学是最热门的领域。公司招不到足够的从业人员。书籍和在线课程层出不穷,许多大学正在开设某种形式的数据科学学位或中心。课程几乎无法满足需求。人们本以为这个黄金时代意味着我们可以做出更好的决策。但矛盾的是,大量的数据会使决策变得更加困难:它不容易转化为有用的信息。访问的普及和专家评论的扩散甚至会使情况变得更加棘手。最后,衡量本身并非一个中立的过程。
例如,在两次飓风登陆前的几天里,主导新闻的是它们在熟悉的萨菲尔-辛普森等级(1到5级,对应持续风速)上的等级,以及风暴可能轨迹的“锥形”。在强制疏散区之外,每个人都必须自己决定该怎么做。正如管理顾问彼得·德鲁克所说:“如果你无法衡量它,你就无法改进它。” 我要补充说:“如果你确实衡量了它,你就会被数字所困。” 这就是风力强度的问题:风力破坏显然很重要,但最糟糕的影响可能来自洪水。弗洛伦斯登陆时只是1级飓风,然后在一些地方(包括远离锥形区域的地方)倾泻了三英尺的雨水。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
为了寻求清晰,我查看了当地电视台的气象学家,他们可以精确定位超出单一数字的当地影响。但可以说,他们倾向于强调危险,这既有利于收视率,也有利于自我保护:如果人们在应该撤离时没有撤离,那就比不必要地逃离要危险得多。所以我准备寻找更多数据。我在社交媒体上找到了天气专家,并找到了一些精心策划的列表。起初这似乎是个好主意。这些都是真正的专家。评论是尊重和明智的。有指向来源的链接,讨论也很丰富。
但我很快就想起了我为什么从不想看香肠的制作过程。我了解了很多关于欧洲和北美天气模型的知识——这很有趣,但当你想决定是否收拾几张有纪念意义的照片并离开时,却相当无用。一个模型预测了毁灭性的破坏,另一个模型只预测了一些大雨。风暴可能会转向北方,直接袭击,或者转向南方——错过。更糟糕的是,每个模型都会定期更新,每次运行都会产生更多的专家讨论。
现在我知道的太多了,但决策的清晰度却更低了。这有时被称为“选择悖论”——过多的选择会使试图做出决定的人陷入瘫痪。这就像你站在超市的番茄酱货架前,不知所措的感觉。有机的还是非有机的?低糖?用蜂蜜增甜?用人造甜味剂——如果是的话,是三氯蔗糖还是阿斯巴甜?低钠?我已经沦落到随便抓一瓶——我只是想要一瓶番茄酱。(好吧,玻璃瓶还是塑料瓶?)
因此,如果更多的数据、更好的科学和更强大的计算能力可以提前这么多天预测飓风的轨迹,为什么没有人能够更好地预测超本地层面的影响?不幸的是,广泛的预测不容易向下渗透,因为个别结果仍然保留着很大的误差范围——假阳性和假阴性太多,难以轻易采取行动。
那么,我们应该放弃在自己的生活中进行数据驱动的决策吗?就像大数据时代中的许多事物一样,前进的道路需要关注数据之外的事物——从如何以及衡量什么,到如何沟通它。我们需要更多坦诚的对话来讨论缺点,以便我们可以改进我们对大量数据和有用信息之间差异的理解。我们尤其需要建立独立的中间机构来帮助指导我们。仅靠数据科学无法做到这一切。
至于飓风,我刚搬到这条街,所以我做了我能想到的最简单的事情:我问了在那里住了很久的邻居。他们建议我储备电池。他们留了下来,我也留了下来。