社会科学建模的 Heisenberg 不确定性原理

这被称为“维度诅咒”,这也是为什么我们对疾病行为方式的估计总是存在不精确性的原因。

可以说,现代科学探究都始于某种模型。模型采用您正在研究的不同参数,并使用它们来对我们世界的运作方式做出某种声明。它是对现实的简化,旨在重建真理的图景,无论是关于疾病的传播、蟾蜍物种的数量,还是 2020 年将要搬家的人数。

但是,随着我们尝试研究的事物数量的增长,接近目标现实的机会就会下降。这种权衡的原因是“维度诅咒”。这并非经验法则或因测量误差造成的限制,而是一个与勾股定理一样的数学事实——它对经济学和其他社会科学可以描述的内容施加了根本性的限制。维度诅咒是为什么我们对疾病行为方式的估计总是存在不精确性的原因。

维度 最常见的是指我们所处的空间和时间,但它也可以指任何一组相互独立的、可测量的东西。例如,假设我们想要一个模型来描述公共卫生运动将如何影响 COVID-19 的传播。我们可能会使用诸如在给定条件下疾病的估计潜伏期(称之为 X)、在公共卫生运动下公众场合佩戴口罩的人的百分比 (Y)、人与人之间传播可能性的估计 (Z) 等因素,来估计传播模式。为了预测我们的广告活动的效果,我们需要找到 X、Y 和 Z 的数值(即“将模型拟合到数据”)。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和想法的具有影响力的故事。


该模型具有三个独立的维度,因此模型参数 X、Y 和 Z 可以被视为 3D 空间中的点。如果我们使用现实世界的数据和建模技术,得到 X、Y 和 Z 的最佳拟合值,我们的估计值会接近真值吗(如果我们是全知的,我们才能直接观察到真值)?

为了回答这个问题,我们需要思考形状在不同维度中的行为方式。

如果你有一个实心形状,周围有一个薄壳,那么这个壳占据了令人惊讶的体积。从超市买一个直径九厘米的橙子,它的皮只有 0.45 厘米厚。大约 25% 的橙子体积在果皮中。

如果你的橙子装在一个礼品盒里,这个盒子的大小正好能让水果接触到所有边,会怎么样呢?退回到二维空间片刻,一个圆占据了最紧密贴合它的正方形体积的 78.5%。在三维空间中,盒子里的橙子占盒子体积的 47.6%,其余是空空气。随着维度数量的增加,盒子内部体积中水果本身所占的百分比进一步缩小。一个四维球体占盒子体积的 30.8%。到九维时,最紧密贴合的盒子有 99.54% 是空的。或者,如果你是乐观主义者,盒子有 0.46% 是满的。

现在,让我们把 COVID-19 模型想象成它存在于三维空间中的形状。想象一下盒子的中心是 X、Y 和 Z 的真值,而紧密贴合的盒子是我们对每个参数本身的最佳猜测范围。将“接近”定义为在壳或紧密贴合盒子中心球体内部。 “接近”这个词具有明显的物理意义,但在信息空间中也很有意义,在信息空间中,我们需要我们对 X、Y 和 Z 的估计值在离真值很短的距离之内。在高维盒子中随意选择的点如此小的概率接近中心,这一事实是维度诅咒的一个例子。

假设我们希望我们的模型更具描述性。一项公共卫生运动可能会导致人们去超市的频率降低 A%,并诱导 B% 的人居家工作,以及 C% 的人停止乘坐公共交通工具。添加这些参数使我们得到一个六维模型 (A, B, C, X, Y, Z),我们可以很容易地集思广益再增加三到四个。如果我们可以对每个变量的数值范围进行良好的界定,我们可以将我们的估计值放在围绕真实九维参数值的紧密贴合的盒子中——这使我们的完整模型(包含所有九个移动部件)接近真值的可能性为 0.46%。

这就是模型设计的平衡之处。我们希望通过添加更多交互元素来使我们的模型更具描述性,但维度诅咒几乎可以保证,如果您尝试将具有大量参数的模型拟合到数据,您的拟合将不会接近。我们可以大致了解公共卫生运动在细节较少的广泛背景下的效果,或者我们可以在关注细节的设置中获得不精确的估计,但是要获得高度的细节和所有这些参数的精确估计几乎是不可能的。

研究人员的解决方案是避免同时估计参数集,接受范围有限且移动部件较少的模型,构建具有更多假设的模型以减少信息维度,或者投入大量工作以非常精确地确定每个参数。简而言之,抵制将最新的数据集拟合到万能模型的欲望。对于研究的读者来说,解决方案是接受不试图成为万能理论的模型的局限性,并对似乎无视诅咒的模型保持怀疑态度。

Ben Klemens is a computational social scientist living in Washington, DC, and the co-host of the podcast "Pod Paper Scissors." He holds a Ph.D. in social sciences from Caltech. His publications include papers on the characteristics of within-U.S. movers, theoretical modeling of patent valuation, and measuring poverty from space.

More by Ben Klemens
© . All rights reserved.