除了上周美国总统大选的主要结果外,投票结果还预示着要证明或诋毁一群撰写博客的统计学家。至少在过去的三个选举周期中,一些博主已经预测了每个州的总统选举获胜者,其准确性似乎接近巫术。他们的秘密是什么?汇总在整个竞选活动中进行的数十项国家和州民意调查,并应用统计学。
统计学家内特·西尔弗受到了很多关注,他在《纽约时报》上撰写了热门博客FiveThirtyEight。但新泽西州普林斯顿大学的神经科学家王 sam 不仅在总统竞选中与西尔弗的准确性相媲美,而且还超越了他,正确预测了西尔弗错过的两场竞争激烈的参议院选举的结果。《自然》杂志与王 sam 谈论了他的爱好,它与他的研究有何关系,以及他是否认为政治竞选还会再有意外。
你做了什么来庆祝你的预测成功?
这件事有趣的地方在于,信息的质量非常高,以至于选举之夜本身有点虎头蛇尾。我和朋友们一起参加了一个观看派对,考虑到各州之间的关联性有多好,一旦我看到新罕布什尔州被宣布[支持巴拉克·奥巴马],我就非常肯定民意调查和往年一样准确。所以,我的不确定性在大约晚上 9:30 结束了。
关于支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
你是如何进入这个领域的?
2004 年,我在关注政治,我对政治非常感兴趣。我沮丧地注意到民意调查中不断出现的噪音,会有俄亥俄州的民意调查,宾夕法尼亚州的民意调查,也许还有另一项来自宾夕法尼亚州的民意调查,与第一项民意调查相矛盾。每项民意调查都伴随着一条令人屏息的新闻报道,说[参议员约翰]克里突然领先,或者[乔治·W·]布什突然领先。作为一名科学家,这让我很困扰,因为人们本质上是在对个别数据点进行彩色评论。
我想要的是一种可以告诉我任何给定时刻竞选温度的衡量标准。所以我炮制了一个荟萃分析,它获取了所有数据,并计算了一个竞选可能走向何处的概率模型。我把它变成了我所说的选举温度计,它可以监测竞选及其随时间推移的起伏。
你作为神经科学家的工作是否为你的爱好提供了信息?
在某种程度上是这样。像许多神经生理学家一样,我使用统计方法来尝试从嘈杂的数据集中提取信号。这是神经科学中常见的问题,时间序列数据的分析也是如此。
您是否正在使用特殊的统计工具来生成预测?
我会说这是简单的基础数学,例如用于稳健性的基于中位数的统计学、概率计算、一些贝叶斯统计分析——但实际上,这些东西都相当简单,任何爱好者都可以掌握。
除了民意调查数据外,模型中还包含什么?经济指标是否具有预测性?
经济数据在分析中不起作用。我认为衡量意见的最佳方法是民意调查专家,他们是各自领域的专家,他们打电话给人们,询问他们的意见是什么。所以我做的计算纯粹基于州民意调查。我正确预测了 50 个州中的 50 个州[包括哥伦比亚特区]的选举结果,而第 51 个州佛罗里达州基本上是平局。在 10 场势均力敌的参议院选举中,我正确预测了所有 10 场。因此,这是一个基准,表明该方法运行良好,不需要任何计量经济学上的巫术。
民意调查是否根据内在偏差进行加权?
不,这更像是暗箱操作……对民意调查感兴趣的人,无论是专业人士还是爱好者,经常会陷入细节。我尝试在做这件事时证明的一件事是,这些细节通常无关紧要,最好退后几步,看看全局。这不带感情色彩,但效果非常好。
内特·西尔弗为撰写博客的统计学家赢得了很大的关注。这是一种烦恼还是一种祝福?
他当然使整个活动更加引人注目。在 2008 年的选举中,他给出了彩色评论,并使民意调查汇总变得有趣。2004 年,我们有很多人在做这件事,我们通常的做法是发布民意调查汇总,而不谈论它们。他做出的创新是给出逐场报道 ——他有体育背景——他让它变得有趣。
什么可能会改变这种方法预测获胜者的能力?
民意调查行业正在发生变化。随着人们越来越难通过固定电话联系到,通过手机或互联网联系到人们变得更具挑战性。[民意调查员]的成功程度将决定数据源的质量。
即将出现的另一件事是数据源是否继续保持高质量。将来有一天,这些数据源可能会被党派组织或其他试图控制信息流的组织所支配。如果发生这种情况,那么整个数据集的完整性就会受到质疑。总的来说,这一切都取决于是否有一个高质量的数据来源。
你认为这是数学的胜利吗?
我确实认为,原则上,这应该让记者和专家在驳斥那些对政治竞选有良好定量理解的人时三思而后行。我认为这对民意调查汇总可以做出的贡献来说是一个很好的展示。