此侧边栏属于专题报道 特别报道:詹姆斯·卡梅隆是否找到了耶稣的墓穴?还是仅仅是一个统计学误差?
克里斯托弗·米姆斯: 当我看到有一位统计学家参与收集纪录片 耶稣失落的墓穴 的证据时,我非常感兴趣。
安德烈·费尔弗格,多伦多大学统计学和数学教授: 当他们要求我为他们运行一些数字时,这次咨询让我感到惊讶。这不是人们通常会做的事情之一——但我是一名统计学家,这就是他们来找我的原因。
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。 通过购买订阅,您将帮助确保未来能够继续报道关于塑造我们当今世界的发现和想法的具有影响力的故事。
我必须告诉你,统计学家与主题 matter 专家(在本例中是圣经历史学者)合作,基本上有义务依赖于他们提出的假设。在某种意义上,我对计算结果负责,但不对其中的具体假设负责。
理想情况下,您想要的是那个时代所有名字的电话簿。有一些类似于电话簿的东西——有一个汇编——我认为它被称为《古代晚期犹太人姓名辞典》,由塔勒·伊兰编辑。(2002 年出版)
这是现有的最学术性的著作之一。它收录了 2509 个男性名字和 317 个女性名字,他们不仅生活在那个时代,而且还生活在那个时代前后大约一百年的时间里(但这只是凭记忆)。塔勒·伊兰汇集了每一个已知的名字参考文献,指向那个时代居住的每一个人,因此我们掌握了我们认为相当好的关于名字频率的数据。例如,我们知道玛丽的每一个版本——mariam——在样本中的 317 名女性中出现了 80 次。对于男性来说,没有一个名字像玛丽那样流行,但有些名字的流行度很高。例如,即使你选择像耶书亚这样的名字,也就是耶稣,塔勒·伊兰的 2509 个名字中实际上有 103 个碰巧是耶书亚的一种形式。
CM: 那么您的方法论和假设是什么?
AF: 让我先告诉你方法论是什么,然后再深入探讨具体的假设。
我们不应该只计算已经观察到的特定事物的概率。因为我们先验地知道已经观察到的特定事物具有低概率。计算背后的想法是说“让我们看看其他每一个可能发生的名称集群,它们只是通过字面上从所谓的电话簿中随机抽样而发生的。然后我们将比较它相对于我们正在观察的事物来说有多么不寻常或令人惊讶。我们将尝试以某种隐含的方式列出所有我们可能已经看到的至少与我们已经看到的同样引人注目的事物。然后你所做的是你取所有这些点并将它们的概率加起来——这就是你的证据价值。这是基本技术,但其中的假设——这些是圣经学者需要审查的东西。
例如,一个非常关键的假设是名字 Mariemene e Mara 的巨大特异性。我不是圣经历史学者,所以我无法审查这一点,我确信它会受到质疑,而且理应如此。但是,如果你看看当时居住的所有 317 名女性中的 80 名玛丽,没有一个名字像 Maremene e Mara 那样具有如此特殊的特异性。
因此,基于我被要求使用的假设,我没有将该特定名称的概率分配为 317 分之 80,而是仅使用了 317 分之 1。换句话说,我假设在每 80 名玛丽中,只有一名会有一个名字版本,该版本如此高度专业化,指向可能是抹大拉的玛丽的人。
集群中出现的另一个非常不寻常的名字是 Yose 这个名字——它的希伯来语拼写很重要。约瑟夫和约瑟以及它的所有版本——这是一个非常常见的名字——在 2509 个男性名字中,有 231 个是约瑟夫。
但 Yose 实际上只在《犹太人姓名辞典》中出现了三次。你可以争论一件事,我不是说我会争论它,但如果有人要求我这样做,我可能会这样做,那就是对于耶稣的兄弟之一来说,这是一个相当合适的姓名版本。如果你查看新约——其中一部福音书列出了耶稣的兄弟,而那个特定的兄弟被命名为 Yose——显然是他希伯来语名字的某种希腊语版本的翻译。这个名字的罕见性在一定程度上推动了我们实际看到的一些数字的尖锐性。
然后你可以尝试做的是,它可能需要近似值,你必须尝试列出所有可能发生的事情,并在每种情况下评估它有多么令人惊讶——然后把你得到的所有至少与你得到的一样令人惊讶的事情都加起来,然后将它们的所有概率加在一起,以获得一种 p 值。
这个 p 值基本上说明了一件事——它说明了在那个时候可能还存在另一个家庭的可能性,这个墓穴可能合理地属于他们;他们的名字集群是这样的,以至于这可能是他们的墓穴。
在进行数学计算时,你必须考虑到已经调查了不止一个墓穴。我认为至少调查了 100 个墓穴。因此,我们看到了 100 次观察中最好的一次,并且至少有 1000 个墓穴地点实际上已知存在,而且实际上可能更多——我被告知总共可能有 2,000 个墓穴地点。因此,我们必须考虑我们所看到的可能是 1000 或 2000 次观察中最好的观察结果这一事实。
根据你如何进行计算,你将得到一定范围的数字,每个统计学家都会有不同的数字范围。你将得到大约 1/100 到可能高达 1/1000 的数字——这是反对存在另一个具有特定名称组合的家庭的几率。
我们还考虑到了许多家庭负担不起骨灰瓮葬礼的事实——那是一项昂贵的提议。关于那个时期以色列人口的估计以及出生率和死亡率的良好估计已经存在。因此,人们可以估计在整个相关时代有多少人死亡。所有这些因素都需要纳入统计计算中。
这些假设是有争议的,这不是秘密。我试图坚持那些对我来说似乎大致合理的事情,但我不是圣经学者——最终我使用了具体的假设,并且我试图明确这些假设是什么。我已经向你明确表示,Mariemene e Mara 铭文的非凡之处被纳入计算中,作为一个非常罕见的名字——其他人可能会说事实并非如此。
说实话,我认为名字集群非常有趣。它在某种程度上是恰当的,那个集群中有很多名字,每次你向集群中添加名字时,它都会改变概率值,所以六个名字对于工作来说不算坏。这是一个令人印象深刻的集合。如果概率数字远低于 1/100,或者远高于 1/1000,那么生活可能会变得更容易。与许多此类事情一样,我们需要说有必要进行进一步研究。因此,圣经学者将不得不仔细思考,以便审查对于此类性质的计算来说合理的假设。
我确实允许在电影中使用 1/600 这个数字。我准备支持这个数字,但前提是这些数字是基于我被要求使用的假设计算出来的。这些假设对我来说似乎并非不合理,但我必须记住我不是圣经学者。
最终,1/600 意味着什么?这个数字表明,在那些能够负担得起骨灰瓮葬礼的人中,在骨灰瓮中出现另一个像那样甚至比那更令人信服的家庭的几率,反对这种几率的数量级是 1/100、1/600 或 1/1000,具体取决于你在你的假设中允许什么。
对于所做的每一个假设,都试图做到合理。我真的无法对此说些什么的两件事是 Mariemene e Mara ——它对抹大拉的玛丽有多么真正合适,以及 Yose 对耶稣的兄弟之一有多么合适,因为这涉及圣经学术部分。
这不是一个经典的假设检验问题。在这里,它更多的是关于事物的概率问题。我试图遵循、反映假设检验的范例。我试图反映那个范例,并且我试图反映罗纳德·费舍尔爵士的思想。他的想法是计算概率,这将使他能够说出这样的话:“要么我们观察到一个极其罕见的偶然事件,要么零假设一定是错误的”——如果你把它追溯到罗纳德·费舍尔时代,这就是假设检验背后的逻辑过程。
CM: 那么您打算在期刊上发表这些结果吗?
AF: 我正在尝试准备一篇论文以供发表,作为一个统计学家的数据集,这是一个非凡的数据集。我认为统计学家可以查看它并开发新的统计技术,这将引起统计学家的极大兴趣。每个人都可能对如何进行、如何分析数据有自己的看法,统计界和历史界之间将进行大规模对话,以了解在这里应该做什么才是正确的。