赢得疯狂三月竞猜池需要多少数学知识?

在“热门”和“冷门”的对立力量之间,隐藏着制胜之道

以下文章经The Conversation(一家报道最新研究的在线出版物)许可转载。

在 NCAA 篮球竞猜池中决定选择哪些球队?那么你面临着一个经典的决策问题——而在这里,科学可以提供帮助。


关于支持科学新闻业

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保未来能够继续发布关于塑造我们当今世界的发现和思想的具有影响力的报道。


一方面,你想选择优秀的球队,即“热门球队”,因为这些球队似乎更有可能获胜。另一方面,你想选择一些较弱的球队,即“冷门球队”,这样你的预测表才能脱颖而出,赢得竞猜池。这两种对立的力量构成了一个有趣的数学问题,因为在两者之间存在一个最优解。

在我内心深处,我总是知道哪些球队会赢,或者至少知道我想支持哪些球队。但作为一名学者,我宁愿通过过度分析情况来榨干其中的所有乐趣。让我们在这里这样做吧!

估计获胜的可能性

为了找到构建我们自己预测表的最佳方法,我们需要首先构建一个数学模型来模拟比赛。

假设我们通过用抛硬币来代替篮球比赛来模拟比赛,只不过硬币不是均匀地正面或反面朝上,而是被加权以反映每场比赛的实际赔率。例如,当西弗吉尼亚大学周五对阵莫瑞州立大学时,我们不进行比赛,而是抛一枚硬币,这枚硬币让种子排名较高的西弗吉尼亚大学有更大的获胜机会。我们需要为每场第一轮比赛、每场潜在的第二轮比赛以及比赛中每种可能的对决抛掷一枚这样的硬币。每枚硬币都必须以模拟实际比赛的方式加权,因此其概率必须由具体的对决来决定。

我们应该从哪里获得这些概率呢?NCAA 在每支球队旁边都提供了一个方便的小数字,即球队的种子排名。在前几轮比赛中,每场比赛都有一个热门球队,这个选择是由拥有大量篮球知识的人做出的。你可以回顾历史并观察到,当 5 号种子对阵 12 号种子时, 5 号种子有 65% 的时间获胜

但还有许多其他方法: 拉斯维加斯博彩赔率 给出了每场比赛的让分盘,根据这些球队的平均得分,你可以将让分盘转换为获胜概率。计算机评分系统比比皆是,你可以通过考虑两支球队之间的评分差异将这些评分转换为概率——这种方法被称为 Bradley-Terry 模型。一些更复杂的系统甚至可以生成一个为比赛中两支球队量身定制的概率。

知道赔率了吗?仍然不容易

因此,选择你最喜欢的方法。即便如此,事情也并不像看起来那么简单。比赛最有可能的结果不一定是所有热门球队都获胜。看看这个例子

想象一个由 A、B、C 和 D 队组成的四队比赛,如图所示。假设 A 总是击败 B,C 以 0.6 的概率击败 D。最后,A 总是击败 D,但只有 0.5 的概率击败 C。唯一可能的结果是:A 战胜 C(概率 0.3),C 战胜 A(概率 0.3)和 A 战胜 D(概率 0.4)。最有可能的结果是冷门 D 击败 C。

更复杂的是,你的办公室或朋友的竞猜池规则可能意味着在后期比赛中正确选择比早期选择获得更多积分。你如何选择一个预测表,让你获得那些关键的后期积分?

在关于这个主题的首批分析论文之一中, Kaplan 和 Garstka给出了一个算法,用于决定哪些选择有望获得最高分。他们的方法是倒序构建一个包含 64 个预测表的列表,逐轮构建,每个预测表都以不同的球队作为获胜者开始。例如,杜克大学的预测表从杜克大学开始,每次添加一轮,规模翻倍,但始终保持杜克大学为获胜者。最后,该算法从 64 个特定于球队的预测表中选择最佳预测表。

这听起来不像人类会做的事情,事实上,它最好由计算机来实现。生成的预测表往往是“保守的”——其中排名较高的球队最有可能获胜——但并不总是选择更高的种子。Kaplan 和 Garstka 确实观察到他们的算法比仅仅自动选择高种子球队做得更好。

重要的是获胜,而不仅仅是得分

到目前为止,我们的模型忽略了一个重要的事实:选择预测表的目标不是获得高分,而是赢得与他人的竞猜池。而且人们的行为是非理性的。

在一项心理学实验中, McCrea 和 Hirt 发现了证据,表明竞猜池参与者追求“概率匹配”:如果一系列比赛(例如, 5-12 对决)历史上三分之一的时间出现冷门,人们会在他们的预测表中尝试预测大约三分之一这些比赛的冷门。事实上,人们在做出此类预测时并不比随机机会做得更好,因此会损害他们在竞猜池中的总体机会。

另一方面,在选择比赛冠军时,人们蜂拥而至选择热门球队。每年, ESPN 锦标赛挑战赛都会发布关于其 1100 万参赛作品的数据。2015 年, 48% 的玩家选择了绝对热门的肯塔基大学作为冠军。选择正确的冠军很重要,但如果其他人都持有相同的观点,那么你也需要很好地选择其他很多比赛。

这使我们回到使这个问题有趣的地方:你需要选择获胜的球队,但不是和所有人选择相同的球队——这样你才能在你的竞猜池中脱颖而出。

为了提高你在竞猜池中的胜算,你需要对你对抗的其他玩家进行建模。每年,大型免费的互联网竞猜池都会发布关于玩家行为的数据,并且他们在你的预测表在周四早上到期之前发布这些数据。

让我们假设人们以我们模拟比赛的相同方式进行选择,即为预测表中的每场比赛抛掷有偏差的硬币。国家互联网竞猜池提供了你正确偏差硬币所需的确切数据。我认识的人中没有人真正以这种方式选择他们的预测表,但事实证明,真实的(人工选择的)预测表和随机预测表具有几乎相同的分数分布。

玩弄赔率意味着漫长的等待

在我自己的研究中,我们使用这个模型来计算最佳选择。生成的预测表在前两轮往往非常保守,在四强赛中包含一两个惊喜,以及一个强大但不是热门的冠军。他们从不,从不,在 5-12 比赛中选择冷门。根据计算机的说法,这些选择将赢得大型互联网竞猜池的机会提高了 100 到 1000 倍。

这听起来很棒。它确实很棒!但是有一个问题:NCAA 篮球锦标赛每年只举办一次。而且你的获胜概率确实非常低——即使有数学和计算机分析的加持。这项策略可能需要数千年才能奏效。

这就是 NCAA 锦标赛科学研究的美妙之处。在预测如此臭名昭著的不可预测事件的荒谬性面前,严肃的建模和数据分析也会退缩。经过十年的研究,我们真正知道的唯一事情是,锦标赛是疯狂的,而且你那位根据吉祥物进行选择的朋友可能会赢得你的竞猜池。

本文最初发表于The Conversation。阅读原文

© . All rights reserved.