本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定代表《大众科学》的观点
“克林顿在2016年假设性对决中击败拜登:民意调查。” 这是MSNBC在7月17日发表的一篇文章的标题,当时距离所讨论的选举还有整整两年。在细则中,NBC报道称误差幅度约为2%至5%,这似乎足够小,可以信任调查结果。但是,我们应该相信希拉里·克林顿肯定会赢得提名吗?
270ToWin.com已经有了一个完整的列表,列出了克林顿与所有潜在共和党候选人的对决,并且显示克林顿几乎在每一场对决中都获胜,但这并不一定意味着她会在三年后成为总统。需要理解的关键是,误差幅度并不总是能描述民意调查中固有的真实误差,因此,那些标榜误差幅度很小的民意调查最终可能会完全错误。
民意调查的概念基于这样的假设:民意调查中抽样人群的意见准确地代表了整个人口意见的分布,但这永远不可能完全真实。“误差幅度”描述了由于相对于人口规模而言,样本量太小而产生的不确定性。一般来说,调查的人越多,误差幅度就越小。但这并没有考虑到另一个关键的误差来源,即“有偏差的抽样”。民意调查抽样了很多人,并不意味着它以真正随机的方式进行抽样,从而可以将结果外推到更广泛的人群。不幸的是,许多民意调查都成为许多偏差的受害者,这些偏差严重歪曲了他们的结果,尽管他们的误差幅度很小。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保关于塑造我们今天世界的发现和想法的具有影响力的故事的未来。
最常见的偏差,称为便利抽样,发生在民意调查员使用方便但不完全随机的策略来选择调查对象时。一个著名的历史例子是1936年罗斯福-兰登总统选举。《文学文摘》吹嘘其民意调查是最准确的,因为他们抽样了大量的人,误差幅度小于1%。他们的民意调查都得出结论,兰登肯定会获胜,但这并没有发生。根据韦恩·乔内尔和P·霍尔特·威尔逊在他们的文章谎言、该死的谎言和统计学:揭示民意调查数据背后的真相中所述,事实证明,该杂志在当时只有富人拥有电话和汽车的情况下,使用汽车登记和电话号码来寻找民意调查对象。由于这些富人倾向于投票给共和党,这极大地改变了其民意调查的结果。
2012年巴拉克·奥巴马和米特·罗姆尼之间的竞争提供了一个更近期的便利抽样偏差的例子。奥巴马最终赢得了51.1%的普选票。然而,来自Rasmussen Reports的最终民意调查显示,罗姆尼在大多数州都更受欢迎。为什么它预测错误的候选人会获胜?可能有很多不同的原因,但一种假设是便利抽样偏差。Rasmussen Reports主要通过固定电话寻找其样本组,而许多人不再使用固定电话。对于那些没有固定电话的人,Rasmussen使用在线调查。这种方法存在几个问题。首先,这意味着该公司只能联系到拥有固定电话或互联网接入的人。然而,根据内特·西尔弗,《FiveThirtyEight》的创始人兼编辑,23%的成年人没有固定电话,4%的人不接听固定电话,2%的人根本没有电话。因此,Rasmussen的方法肯定会使民意调查偏向于仍然使用固定电话的更富有和更年长的群体,而这两个群体都倾向于投票给共和党。
民意调查误差的另一个可能来源被称为志愿者偏差,即自愿向民意调查提供意见的人并不代表整个人口的分布。例如,在拥有固定电话的群体中,有些人通过简单地挂断电话来回应民意调查电话,通过自动信息进行民意调查的做法使这种结果在社会上更容易实现,正如Rasmussen所做的那样。那些花时间听取自动信息并做出相应回应的人是那些强烈认为他们的意见必须被听到的人。根据查尔斯·塞夫在他的著作《数字的欺骗性:你如何被数字愚弄》中所说,对于有在任者的总统选举,那些对自己的意见非常直言不讳的人通常是那些会投票反对在任者的人,因为他们通常对现状不满意,并认为需要改变。那些会投票给在任者的人往往对国家现状更满意,因此不觉得自己的意见需要被强烈表达。
Rasmussen使用在线调查进一步加剧了志愿者偏差。填写在线调查需要时间和精力,而不是仅仅在电话中回答某人,这降低了那些未决定或仅略微倾向于一方的人做出回应的可能性。它也更没有人情味,使人们更容易忽略它。对在线调查的这些保留意见可能会在民意调查中产生大量误差。
进行民意调查的时间也会影响其误差幅度。内特·西尔弗在他的著作《信号与噪声》中报告说,随着选举临近,民意调查的准确性急剧提高。在选举前一年进行的民意调查对于领先5个百分点的候选人来说只有59%的准确率,但在选举前一天却有95%的准确率。如果你愿意,这种时间偏差在2012年总统选举中得到了清晰的展现,因此,对于现在发布的对2016年做出预测的民意调查持怀疑态度是有益的。
在今天的期中选举之后,将进行更多的民意调查,更多的数据将被喷射到国家新闻网络上。为了成功地筛选大量数据,我们必须牢记所有民意调查中固有的由于样本量和方法论造成的误差。民意调查数据很少是完美的,并且常常是不确定的或具有误导性的,因此关注细节是有益的。