哥伦比亚大学应用数学副教授克里斯·威金斯提供了以下解释。
一位病人去看医生。医生进行了一项可靠性为 99% 的测试——也就是说,99% 的病人测试结果呈阳性,99% 的健康人测试结果呈阴性。医生知道,全国只有 1% 的人患病。现在的问题是:如果病人的测试结果呈阳性,那么病人患病的几率是多少?
直觉上的答案是 99%,但正确答案是 50%,贝叶斯定理给出了我们在这个问题中已知和想知道的事物之间的关系。我们已知的是 p(+|s),数学家会将其读作“在您生病的情况下测试结果呈阳性的概率”;我们想知道的是 p(s|+) 或“在您测试结果呈阳性的情况下生病的概率”。定理本身读作 p(s|+) = p(+|s)p(s)/p(+),尽管 1702 年至 1761 年在世的贝叶斯牧师实际上说的是更简单的东西。贝叶斯陈述了定义关系,将您测试结果呈阳性且生病的概率表示为,在您生病的情况下您测试结果呈阳性的可能性,与您生病的“先验”概率(即,在指定特定患者和进行测试之前,患者生病的概率)的乘积。
支持科学新闻事业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻事业 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
与其依靠贝叶斯数学来帮助我们解决这个问题,不如考虑另一个例子。假设上述故事发生在一个小国,人口为 10,000 人。从先验 p(s)=0.01 中,我们知道 1%,即 100 人患病,9,900 人健康。如果我们对每个人进行测试,最有可能的结果是 100 名病人中有 99 名测试结果呈阳性。然而,由于测试有 1% 的错误率,因此也有可能 99 名健康人测试结果呈阳性。现在,如果医生将所有测试结果呈阳性的人送到国家医院,那里的健康病人和患病人数将相等。如果您遇到其中一位,即使您掌握了该患者测试结果呈阳性的信息,这个人患病的几率也只有 50%。
现在想象一下,医生搬到了另一个国家,进行相同的测试,具有相同的可能性 (p(+|s)),并且对于健康人来说,成功率也相同,我们可以称之为 p(-|h),“在一个人健康的情况下得分阴性的概率”。然而,在这个国家,我们假设每 200 人中只有一人患病。如果一位新患者测试结果呈阳性,那么实际上该患者健康的概率高于患病概率。医生需要更新先验。(正确的概率留给读者作为家庭作业。)
定量建模中准确数据的重要性是问题中提出的主题的核心:使用贝叶斯定理来计算上帝存在的概率。对宗教的科学讨论是目前的热门话题,有三本新书反对有神论,其中一本是牛津大学教授理查德·道金斯 (Richard Dawkins) 的著作《上帝的错觉》(The God Delusion),专门反对使用贝叶斯定理来分配上帝存在的概率。(在撰写本文时,在 Google 新闻中搜索“Dawkins”会弹出 1,890 条新闻。)使用贝叶斯定理的论点计算了在我们在世界上的经验(邪恶的存在、宗教经验等)下上帝的概率,并为这些事实在上帝存在或不存在的情况下的可能性分配了数字,以及对上帝存在的先验信念——如果我们没有来自我们经验的数据,我们将分配给上帝存在的概率。道金斯的论点并非针对贝叶斯定理本身的真实性,其证明是直接且无可辩驳的,而是针对那些使用该公式来论证上帝存在的人缺乏可放入该公式的数据。该等式是完全准确的,但插入的数字,用道金斯的话来说,“不是测量的量,而是 & 个人判断,为了练习而转化为数字。”
请注意,尽管这现在受到了很多关注,但量化一个人的判断以用于贝叶斯计算上帝的存在并非新鲜事。例如,理查德·斯温伯恩 (Richard Swinburne) 是一位从科学哲学家转变为宗教哲学家的人(也是道金斯在牛津大学的同事),他在 1979 年估计上帝存在的概率超过 50%,并在 2003 年计算出复活的概率[据推测是耶稣和他的追随者] “大约为 97%”。(斯温伯恩为上帝分配了 50% 的先验概率,因为只有两种选择:上帝存在或不存在。另一方面,道金斯认为“人们在某个时候或某个时候相信过无数事物……上帝、飞行面条怪物、仙女或任何其他事物”,这将相应地降低每个结果的先验概率。)在回顾贝叶斯定理和神学的历史时,人们可能会想知道贝叶斯牧师对此有何看法,以及贝叶斯是否将他的定理作为类似论证上帝存在的一部分引入。但这位善良的牧师对此主题只字未提,他的定理是在他死后作为他对预测给定特定条件下事件概率的解决方案的一部分而引入的。事实上,虽然有很多关于彩票和双曲对数的资料,但在贝叶斯的“解决机会学说中问题的论文”中,没有提及上帝,该论文在他去世后于 1763 年提交给了伦敦皇家学会(并且可以在 www.stat.ucla.edu/history/essay.pdf 在线获取)。
今天,贝叶斯定理的一个主要科学价值在于将模型与数据进行比较,并根据这些数据选择最佳模型。例如,假设有两个数学模型 A 和 B,从中可以计算出给定模型 (p(D|A) 和 p(D|B)) 的任何数据的可能性。例如,模型 A 可能是时空为 11 维的模型,模型 B 可能是时空为 26 维的模型。一旦我进行了定量测量并获得了一些数据 D,就需要计算两个模型的相对概率:p(A|D)/p(B|D)。请注意,就像将 p(+|s) 与 p(s|+) 相关联一样,我可以将此相对概率等同于 p(D|A)p(A)/p(D|B)p(B)。对于某些人来说,这种关系是深刻喜悦的源泉;对于另一些人来说,则是令人发狂的挫败感。
这种挫败感的根源是未知的先验,p(A) 和 p(B)。对数学模型的概率有先验信念是什么意思?回答这个问题开启了“贝叶斯主义者”和“频率主义者”之间一场痛苦的内部争斗,这是一场最好不要卷入的数学帮派战争。为了过度简化,“贝叶斯概率”是对概率的一种解释,将其视为对假设的置信度;“频率主义概率”是对概率的一种解释,将其视为特定结果在大量实验试验中出现的频率。在我们最初的医生案例中,估计先验可能意味着更可能和不太可能的预后之间的差异。在模型选择的情况下,特别是当两个争论者持有强烈且截然相反的先验信念(相信与不相信)时,贝叶斯定理可能会导致比清晰更冲突。
更一般地说,贝叶斯定理用于任何计算“边际”概率(例如,在示例中测试结果呈阳性的概率 p(+))的计算,该概率来自可能性(例如,在生病或健康的情况下测试结果呈阳性的概率 p(+|s) 和 p(+|h))和先验概率(p(s) 和 p(h)):p(+) = p(+|s)p(s) + p(+|h)p(h)。这种计算非常普遍,以至于几乎每个概率或统计学的应用都必须在某个时候调用贝叶斯定理。从这个意义上说,贝叶斯定理是遗传学到谷歌、健康保险到对冲基金等一切事物的核心。它是具体思考不确定性的核心关系,并且——在给定定量数据(可悲的是,这并非总是给定的)的情况下——将数学用作清晰思考世界的工具。