为什么数学像蜜獾:内特·西尔弗的崛起

加入我们的科学爱好者社区!

本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定代表《大众科学》的观点


“忽视数学会损害所有知识,因为不了解数学的人无法了解其他科学或世界上的事物。更糟糕的是,那些如此无知的人无法意识到自己的无知,因此不寻求补救。”—— 罗杰·培根

很多人讨厌和害怕任何形式的数学,这已经不是什么秘密了。我当然也花了半辈子来对抗看到方程式时本能的退缩,而且我在写《微积分日记》时采访的许多人甚至有更极端的反应。他们谈到手心出汗、冒冷汗,以及遇到任何与数字有关的东西时,胃里都会感到一阵寒意。正如我的朋友李所说,她最初的高中代数不及格:“它以一种其他任何事情都无法比拟的方式摧毁了我的自信,并且仍然让我感到胃痛。我并非完全不识数,但任何看起来像方程式的东西都会让我冒冷汗,然后尖叫着逃跑。”

另一位朋友艾莉森则更加直言不讳:“我对‘微积分’这个词的最初反应,就像一个穴居人因为无知和恐惧而向月亮扔石头,最终导致盲目的愤怒。世上没有鬼魂会偷偷摸摸地爬上我身后的楼梯,但世上却有像多项式怪物这样的东西,它有钩状的牙齿,而且我确信它会导致慢性酵母菌感染。”


关于支持科学新闻业

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


我不能谈论酵母菌感染,但是一项新的心理学研究表明,这种反应确实具有真实、可测量的生理影响。具体来说,当涉及到神经反应时,数学焦虑与身体疼痛的感觉非常相似。似乎引发测试对象焦虑和痛苦反应的不是数字本身,而是对遇到数字的预期。

人们对此做出这种反应的原因有很多复杂之处,但其中一个原因可能是数学太他妈的顽固不屈,是异想天开的敌人,用它冷酷的事实击碎了我们最珍视的希望。它感到抱歉吗?它才不会!就像臭名昭著的蜜獾一样,数学不在乎。数学根本不在乎。

同样像蜜獾一样,数学最近也展现出自己相当厉害的一面。如果要为数学素养提出一个确凿的理由,那就是过去几周《纽约时报》的明星统计学家内特·西尔弗和他的 538 博客(以选举团的 538 张选票命名)所发生的事情。

对于至今还不认识西尔弗这个名字的 0.1% 的人来说,他最初是分析棒球队的统计概率,然后将注意力转向 2008 年总统选举。他设计了一个相当复杂的数学模型,该模型不仅仅依赖于这里和那里的一些民意调查,而是将所有民意调查都输入到模型中,并进行额外的调整以消除不可避免的抽样误差。结果非常令人印象深刻:他正确预测了 50 个州中的 49 个州以及当年的许多国会竞选。

快进到 2012 年总统大选,当时大多数评论员都将这场竞选描述为米特·罗姆尼和巴拉克·奥巴马之间真正的不相上下。随着党派紧张局势加剧,西尔弗的预测成为一个方便的目标,因为他的模型始终如一地给出奥巴马比普通专家更高的统计胜算。即使在奥巴马竞选活动的低谷时期,在第一次辩论之后,西尔弗的模型仍然预测总统有大约 66% 的连任机会——这主要基于他对关键战场摇摆州民意调查趋势的严格分析。在选举日一周前,这些赔率增加到大约 75%,稳步上升到最终预测的 90.9%。

这与保守派评论员形成了鲜明对比,他们似乎生活在一个奇异的另类现实中,罗姆尼略微领先,并准备赢得许多战场州。乔治·威尔、佩吉·努南、纽特·金里奇、福克斯新闻的数字专家迈克尔·巴罗内和共和党策略师卡尔·罗夫都预测罗姆尼将稳操胜券,赢得 300 多张选举人票和普选票,而迪克·莫里斯则跳上了疯狂的列车,预测罗姆尼将大获全胜。(嘿,总得有人接受冷门赔率!)

如何解释这种差异?保守派发起攻势,攻击西尔弗的分析带有不可救药的偏见——他们说,每个人都知道西尔弗“偏袒”奥巴马——并且过度依赖于偏袒奥巴马的民意调查。最后这一指控甚至催生了一个独立的网站 Unskewed Polls,声称要进行公正的分析——让人想起福克斯新闻可笑的“公正和平衡”的口号。(嗯。保守派对西尔弗在 2010 年预测共和党在众议院获得重大进展并没有问题,事实证明,这一预测也非常准确。)

攻击变得非常人身攻击,大卫·布鲁克斯称西尔弗“被高估了”,MSNBC 的乔·斯卡伯勒贬低他是意识形态分子和“笑话”,甚至 Politico 的迪伦·拜尔斯也在思考西尔弗是否是“昙花一现的名人”——好像重要的是他的名气,而不是数字。而 Unskewed Polls 的创始人迪恩·查尔默斯,在 《The Examiner》 上嘲笑西尔弗是“一个身材矮小的人,一个瘦弱而女性化的男人,声音柔和,听起来几乎完全像拉什·林博在节目中使用的‘新阉伶先生’的声音。”

老实说,一个瘦弱的、自由派知识分子、娘娘腔的男人,声音微弱,真的能告诉我们关于如此接近的选举什么信息呢?仅仅依靠像数字巫术这样神奇而无形的东西?西尔弗发挥了他内在的蜜獾精神,出色地处理了强烈反对,有力地捍卫了他的统计方法论,驳斥了巫术和党派偏见的指控,并在 Twitter 上厚颜无耻地回应了他的批评者。

(我最喜欢的西尔弗推文,在超级风暴桑迪摧毁纽约和新泽西州之后:“‘不敢相信气象学家使用数学和科学来预测这场风暴。他们一定是魔法巫师。’”

他继续埋头苦干他的预测模型,每天输入民意调查数据并进行数据处理,考虑混杂因素和潜在的偏见来源,相信数学胜过专家的直觉。正如许多其他人指出的那样,在对西尔弗的批评背后,对统计概率统计概率无知程度非常之高——(并不是说他的模型中没有值得批评的地方,但抱怨他声音微弱和身材矮小并不在此列)。

显然,对所有与数字相关的事物的普遍反感困扰着一些原本非常聪明的人。但这种强烈抗议在很大程度上也是我们社会某些圈子中盛行的反智主义的一部分。在 Deadspin 的一篇帖子中,大卫·罗赫尔评论道:“专家战争蔓延到内特·西尔弗的电子表格单元格中只是时间问题。”斯蒂芬·科尔伯特令人难忘地说,现实具有众所周知的自由主义偏见;显然,这种偏见也延伸到了数学。

(对于那些渴望了解更多细节的人,北卡罗来纳大学的泽伊内普·图费克奇在 《Wired》 上提供了对西尔弗和统计建模方法的最佳辩护之一:查看一下。)

西尔弗不是先知,也从未声称自己是先知,因此过度反应简直是愚蠢的。当然,到 10 月下旬,538 的模型预测奥巴马以 79% 对 21% 的优势领先,而全国民意调查平均值表明势均力敌。但是任何优秀的扑克玩家都会告诉你,21% 的优势牌获胜的频率很高——即 21% 的时间。事实上,西尔弗本人在选举日前的最后一篇文章中使用了扑克比喻,估计罗姆尼赢得选举的机会与抽到内顺子的几率大致相同。

[在扑克中],形成内顺子需要你从牌堆中剩下的 48 张牌中抓到 4 张牌中的一张,其几率约为 8%。根据 FiveThirtyEight 的预测,现在罗姆尼先生赢得选举人团的机会大约就是这个数字。

正如任何扑克玩家都知道的那样,这 8% 的几率有时会发生。如果今年发生这种情况,那么许多民意调查公司将不得不重新审视他们的假设——我们将不得不重新审视我们对民意调查的可信度的看法。但赔率表明奥巴马先生将再次当选。

后来,他略微修改了这些赔率,给罗姆尼先生 9.1% 的机会爆冷——主要是为了考虑到他的批评者一直在叫嚣的民意调查中潜在的亲奥巴马偏见。那么西尔弗在预测实际选举中表现如何?看看这个

太棒了!看,这就是数据,它非常强大!西尔弗正确预测了 50 个州中的 50 个州,甚至将普选票精确到了百分之零点几。当上面的图表在 Twitter 上发布时,阿拉斯加州的投票结果尚未记录,但正如预测的那样,该州归罗姆尼所有。唯一的真正不确定州佛罗里达州——西尔弗预测该州有 50/50 的几率——在技术上仍然不是最终结果(截至 11 月 7 日星期三下午 5 点),正在等待迈阿密-戴德县的选票,该县非常支持奥巴马,奥巴马已经略微领先。预计佛罗里达州也将归入奥巴马的阵营,因此西尔弗备受争议的最后一刻将佛罗里达州从浅粉色改为浅蓝色是合理的。(要了解其他人的表现,请查看此图表。)

此外,他的图书销量正在飙升,他很有可能与《泰晤士报》谈判达成一份更赚钱的合同,并且他启发了自己的查克·诺里斯风格的 Twitter 标签,#NateSilverfacts。(我目前最喜欢的一条:“当受到专家批评时,内特·西尔弗不会生气——他会回归均值。”)哦,还有一个讽刺网站宣称西尔弗是巫师。人们可以想象,西尔弗在他的办公室里兴高采烈地跳着江南 style,完全被选举结果证明是正确的——尽管更有可能的是,考虑到他在过去几周的频繁更新,他已经筋疲力尽地倒下了。但他当然有权沉浸在一点幸灾乐祸之中。

当然,这只是总统竞选。我还没有看到对他对其他竞选的预测的全面评估,但北达科他州至少发生了一次重大意外,海蒂·海特坎普(不是海特伯格,原始帖子中的笔误)以微弱优势击败了对手里克·伯格,尽管西尔弗给了后者 92.5% 的连任机会。

而且他在蒙大拿州的竞选中也失误了,民主党候选人轻松获胜,尽管西尔弗给了他的共和党对手 66% 的获胜机会(尽管蒙大拿州的民意调查要少得多,因此数据样本也没有那么大)。所以,你知道,这个人并不完美。这就是统计不确定性。

不过,引用经典的 xkcd 漫画:科学!它奏效了,混蛋!数学不在乎你希望什么是真的:它如实反映事实,否认主义去死吧。蜜獾衷心赞同。

这就是为什么观看福克斯新闻关于选举报道的崩溃如此引人入胜的原因:否认主义直接撞上了基于数字的现实,并戳破了保守派专家的泡沫。认知失调显而易见。(正如史蒂夫·米尔斯基在 Twitter 上指出的那样,“福克斯新闻正在经历精神崩溃。”)

罗夫实际上在直播中表示反对,当时福克斯新闻的独立选举分析师宣布奥巴马胜选,坚称罗姆尼在俄亥俄州仍然有获胜的机会。主持人梅根·凯利走到分析师的办公桌前,要求做出解释。

值得称赞的是,分析师们(他们已经做了数学计算)没有退缩:“我们对这个结果感到非常满意。”当然,分析师们是正确的,罗夫——一个聪明、精通数学的人,当他不被党派偏见蒙蔽双眼时——最终勉强承认了这一点。(巴罗内、金里奇和莫里斯也是如此。)

那么内特·西尔弗是新一代的极客之神吗?我们都应该向我们瘦弱、女性化的数学巫术霸主低头吗?别急。正如今天早上一些人指出的那样,西尔弗当然不是唯一一位预测奥巴马连任机会很大的精通民意调查的统计学家——最值得注意的是,山姆·王的 普林斯顿选举联盟给奥巴马 98% 的连任机会。他只是最引人注目的。

西尔弗的天赋是将严谨的统计建模与精明的平民化方法相结合。但他确实承受了大部分批评,因此他理应获得相应的回报。具有讽刺意味的是,西尔弗还在对 Buzzfeed 的采访中预测了选举后对其分析的反应:“我确信我的预测结果承载了很多。我也确信,如果预测正确,我会得到过多的赞扬,如果预测错误,我会受到过多的责备。”

真正的赢家不是西尔弗,而是数学。2012 年的选举是对统计建模准确性的一次实时实验,结果非常出色。这并不意味着仍然没有改进的空间,或者这种模型是绝对可靠的,但基本原则是可靠的。目前是这样。称之为书呆子的胜利。我怀疑我们已经看到了否认主义的终结,还差得很远,但偶尔,科学的严谨性取得重大胜利是令人欣慰的。

 

© . All rights reserved.