本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点
很可能,您本月听说了关于一个微小的基本物理粒子的发现,它可能是长期以来人们寻求的希格斯玻色子。科学家们用“五西格玛”这个词来描述这项发现的强度。那么,五西格玛是什么意思呢?
简而言之,五西格玛对应于一个 p 值,或概率,为 3x10-7,或大约 350 万分之一。 这不是希格斯玻色子存在或不存在的概率; 相反,它是指如果该粒子不存在,瑞士日内瓦的欧洲核子研究中心 (CERN) 科学家收集的数据至少与他们观察到的数据一样极端的概率。“之所以如此令人恼火,是因为人们想听到明确的陈述,例如‘存在希格斯玻色子的概率是 99.9%’,但真正的陈述中有一个‘如果’。这里有一个条件。没有办法消除这个条件,”凯尔·克兰默说,他是纽约大学的物理学家,也是 ATLAS 团队的成员,该团队是 7 月 4 日在日内瓦宣布新粒子结果的两个团队之一。
科学家使用 p 值来检验假设的可能性。在比较现象 A 和现象 B 的实验中,研究人员构建了两个假设: “A 和 B 不相关”,这被称为零假设,以及 “A 和 B 相关”,这被称为研究假设。
支持科学新闻事业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻事业 订阅。 通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和思想的具有影响力的故事。
然后,研究人员假设零假设(因为这是智力上最保守的假设),并计算在 A 和 B 之间没有关系的情况下,获得与他们观察到的数据一样极端或更极端的数据的概率。这种计算(产生 p 值)可以基于几种不同的统计检验。如果 p 值很低,例如 0.01,这意味着仅有很小的机会(对于 p=0.01 而言为百分之一)在没有相关性的情况下偶然观察到数据。通常,在研究领域中会预先设定一个阈值,用于拒绝零假设并声称 A 和 B 相关。p=0.05 和 p=0.01 的值在许多科学学科中非常常见。
高能物理学需要更低的 p 值才能宣布证据或发现。“粒子证据”的阈值对应于 p=0.003,而“发现”的标准是 p=0.0000003。
如此严格标准的原因是,几个三西格玛事件后来被证明是统计异常,物理学家不愿宣布发现,然后又发现结果只是一个突发事件。一个因素是“他处查找效应”:当分析非常宽的能量区间时,很可能在某个特定能量水平上您会看到一个统计上不太可能的事件。作为一个具体的例子,连续抛掷 100 次普通硬币并至少得到 66 次正面的概率略低于百分之一。但是,如果一千人每人连续抛掷相同的硬币 100 次,则很可能有些人每次至少会得到 66 次正面;这些事件中的任何一个都不应单独解释为硬币被某种方式操纵的证据。
那么西格玛从何而来呢?希腊字母西格玛 (σ) 用于表示标准差。标准差衡量数据点围绕均值或平均值的分布,可以被认为是点或值的分布有多“宽”。具有高标准差的样本更分散——它具有更大的变异性,而具有低标准差的样本更紧密地聚集在均值周围。例如,狗身高的图表的标准差可能比特定品种的狗身高的图表更大,即使该品种的平均身高与一般狗的平均身高相同。
对于粒子物理学,使用的西格玛是来自数据正态分布的标准差,我们熟悉正态分布,即钟形曲线。在完美的钟形曲线中,68% 的数据在均值的一个标准差范围内,95% 的数据在两个标准差范围内,依此类推。
就上周宣布的结果而言,这个过程比简单地从一个实验中获取结果并测量数据与预期背景水平的偏差更为复杂;数据来自许多不同的通道,并且每个通道都有不同的预期背景信号。此外,探测器的测量存在不确定性,必须加以考虑。研究人员使用了一个复杂的公式来组合所有这些变量并计算 p 值。然后,该值被转换为高于均值的西格玛数,因为在新发现粒子的能量下观察到的碰撞次数高于预期的背景。
最后一点导致媒体对与五西格玛相关的 p 值产生了一些困惑。在正态分布中,数据对称分布在均值的两侧。数据在高尾或低尾中的概率是仅在高尾中的概率的两倍,因此一些媒体报道称五西格玛对应于 p 值为 0.0000006,或 170 万分之一,而不是正确的 0.0000003,或 350 万分之一。有关此细微之处的进一步讨论,请参阅此理解不确定性博客文章。
对希格斯发现的兴奋导致两个团队在所有数据都分析完成之前宣布了他们的结果。展望未来,在两个团队的分析都完成后,各组将合并他们的观测结果。尽管这两个实验都基于相似的物理原理,但以有意义的方式合并他们的数据并非易事。如果您的钱包里装满了美元和欧元(或者如果您访问欧洲核子研究中心,则装满了瑞士法郎),您不能简单地将钞票上的数字相加来算出您有多少钱;您必须先进行一些换算。各组将使用克兰默称之为“协作统计建模”的方法来合并两个实验(ATLAS 和 CMS)的结果。这种方法已经用于对每个团队实验中的数据集执行“换算”。完成后,这些分析将传达对新证据强度的更准确的认识,并确定观察到的数据是否与物理学家寻求的希格斯玻色子一致。