你是否曾经觉得你的朋友比你拥有更多的朋友? 尽管你的妈妈可能会坚持认为你和他们一样受欢迎,但数学的检验悖论解释了为什么你可能是对的。它还揭示了为什么你经常觉得等待火车或公共汽车的时间太长,为什么呼叫中心总是显得呼叫量高于平均水平,以及其他日常挫折。
考虑一下像Facebook这样的社交网络,普通用户拥有数百位朋友。 拥有10,000位朋友的人会出现在其他10,000位用户的朋友列表中,这使得许多(普通)人相比之下感到不受欢迎。 另一方面,只有五位朋友的人只出现在他们五位朋友的列表中,最多只让五个人感到受欢迎。 这就是关键思想:一个人在其他用户的朋友圈中的代表性与他们自己的受欢迎程度成正比。 你更有可能拥有非常受欢迎的朋友,正是因为他们受欢迎。 别告诉你妈妈。
只需考虑下面这个简单的社交网络
关于支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。 通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和想法的重要故事。

来源:Amanda Montañez
钱德勒有三个朋友,莫妮卡和菲比各有两位朋友,而珍妮丝有一位朋友,总共有八位。 然后我们将这八位朋友除以网络中的四个人,得到平均两位朋友。 然而,请注意,莫妮卡的朋友平均有 2.5 位朋友(钱德勒的三位加上菲比的两位,全部除以二)。 莫妮卡的朋友平均拥有的朋友比她多(2.5 > 2),这可能会让她感到相对不受欢迎,即使她实际上非常普通。 她对她直接朋友圈的局部视角讲述了一个与她在整个网络中地位的全局视角不同的故事。
菲比和珍妮丝也遇到了同样的情况,她们的朋友平均分别有 2.5 位和 3 位朋友。 只有钱德勒的朋友圈相对不受欢迎,平均朋友数约为 1.67 位。 这个群体中的大多数人都不如他们的朋友受欢迎。 量化这种情况的另一种方法是查看一个人的朋友在这个网络中拥有的平均朋友数量,大约为 (2.5 + 2.5 + 3 + 1.67)/4 = 2.42。 这个数字大于普通人的朋友数(两位)。
令人惊讶的是,这种情况总是会发生在每个网络中(除非每个人都拥有相同数量的朋友,在这种情况下,数量将相等)。 平均而言,人们的合著者拥有的合著者比他们自己多,并且他们的性伴侣拥有的性伴侣比他们自己多。 尽管这种网络动态有时被称为友谊悖论,但它们属于一种更普遍的现象,称为检验悖论。
检验悖论根本不是悖论,因为两种观点可以同时有效。 当个人认为平均值大于全局视角所暗示的平均值时,表面上的矛盾就会出现,因为他们更有可能遇到大型实例。 在我们假设的网络中,莫妮卡的朋友比她更受欢迎,而且她也拥有普通数量的朋友。
感到困惑? 这里有另一个例子。 询问大学生他们的平均班级规模是多少,答案总是比学校管理部门官方报告的平均班级规模要大。 这些学生是在夸大其词吗? 学校管理部门是否在缩减数字以使其师生比例看起来更理想? 不——两种观点都是正确的。 大型讲座课程的学生自然会报告更大的班级规模平均值,而只参加小型研讨会的学生会报告更小的班级规模平均值,但两者都给出了准确的报告。 前者群体的人数远多于后者,因为讲座厅容纳的人数多于小型研讨会。 调查学生时,高注册人数的课程被计算的次数多于低注册人数的课程,而当大学统计平均班级规模时,大型讲座和小型研讨会都只计算一次。
平均而言,人们的朋友比他们拥有的朋友多,他们的性伴侣比他们拥有的性伴侣多。
检验悖论在一些最平凡的地方也发挥着作用。 假设一个交通管理局承诺其地铁列车平均每八分钟通过一个车站。 如果您在列车之间随机到达车站(忽略高峰时段),那么有时您会坐七分五十秒,有时您会在刚穿过旋转门时听到迎面而来的鸣笛声。 您可能期望这些情况会随着时间的推移平均为大约四分钟的等待时间。
那么为什么总是感觉比这更长呢? 当然,列车平均每八分钟到达并不意味着每隔八分钟准时到达。 时刻表通常是错开的。 但为什么你的坏运气总是让你陷入漫长的间隔中呢? 这不是坏运气; 这只是概率。 您更有可能在长时间间隔内到达,仅仅是因为它们更长。

来源:Amanda Montañez
下面的示例时间轴描述了列车之间的六个间隔——其中一半持续 12 分钟,另一半持续 4 分钟。 交通管理局可以宣传列车之间的平均间隔为八分钟,但个体通勤者在长时间间隔内出现的可能性是其三倍,并会经历令人沮丧的等待。
科学家需要对检验悖论及其可能引起的偏差保持警惕。 例如,要进行一项关于大学平均班级规模的研究,必须明确说明要测量的内容,并相应地调整抽样方法。
但一些聪明的研究人员也利用这种现象来改进他们的随机抽样。 一个特别有趣的例子来自一项关于流感传播的研究。 在爆发期间,社交联系良好的人由于其高社交接触而往往更早感染疾病。 为了快速检测疫情,流行病学家可以优先监测这些人,如果他们事先知道这些人是谁的话。 检查人群中随机成员的流感状况的朴素方法没有优先考虑社交联系良好的人,而绘制社交网络的结构将花费太多时间。 相反,研究人员尝试随机挑选人员并监测他们的朋友。 这种轻微的调整大大提高了社交联系良好的人出现在样本中的机会,正如我们所见,人们的朋友往往比他们更受欢迎。 这种技术使研究人员能够比传统的随机抽样提前两周检测到流感爆发。
即使对于我们这些不从事研究工作的人来说,检验悖论也可以帮助解释我们的日常观察。 为什么呼叫中心总是显得呼叫量高于正常水平? 也许他们只是那样说来为人员不足找借口,或者也许我们都倾向于在同一时间打电话,例如在午休时间。 但也许我们更有可能属于更大的同步呼叫者群体,正是因为它更大。 如果航空公司抱怨买票的人不够多,他们被迫飞行几乎空无一人的飞机,为什么你如此难得地享受无人争抢的扶手的奢侈? 因为总的来说,很少有人这样做。 有时,当您感到运气不佳时,更广阔的视角确实可以提供帮助。 至少在你等待下一班火车时,这可以让你思考。