本文发表于《大众科学》的前博客网络,仅反映作者的观点,不一定反映《大众科学》的观点
作为生物化学系统建模者,我的职业生涯中一直面临着一个永恒的挑战,那就是需要在准确性和可靠性之间取得平衡。这个悖论并不像看起来那么奇怪。通常,当你构建一个模型时,你会包含许多近似值,目的是使建模过程更容易;理想情况下,你希望模型尽可能简单,并且包含尽可能少的参数。但是这种策略并非总是奏效,因为有时你会发现,在追求简化的过程中,你遗漏了一个关键因素。所以现在你包含了这个关键因素,却发现模型中的不确定性急剧增加。在这种不幸的情况下,发生的事情是,在包含来自先前排除的因素的信号的同时,你也必然包含大量的噪声。这种噪声通常可能来源于对该因素的不完全了解,无论是来自计算还是来自测量。因此,各种类型的建模者都必须在尽可能多地包含现实情况与使模型足够准确以进行定量解释和预测之间取得微妙的平衡。
似乎这正是气候变化模型开始困扰的问题。《自然》杂志最近一期发表了一篇非常有趣的文章,探讨了气候科学中使用模型的一个看似完全矛盾的特征;随着模型变得越来越现实,由于不确定性的增加,它们也变得越来越不准确和不可预测。我只能想象这对气候建模者来说是一个非常痛苦的事实,他们似乎正面临着他们领域中相当于海森堡不确定性原理的情况。现在是处理这些问题尤其令人担忧的时期,因为建模者需要将他们的预测纳入今年即将发布的下一份 IPCC 气候变化报告中。
更仔细地观察这些模型就会发现,这种行为并不像听起来那么矛盾,尽管目前还不清楚如何解决这个问题。这篇文章尤其引起了我的共鸣,因为正如我之前提到的,类似的问题经常困扰着化学和生物学研究中使用的模型。就气候变化而言,事实是早期的模型非常粗糙,没有考虑到许多现在正在纳入的细粒度因素(例如冰穿过云层的速度)。原则上甚至在实践中,存在着数量惊人的此类因素(部分地由顶部的图片例证)。幸运的是,模型的粗糙性也阻止了与这些因素相关的不确定性被纳入建模中。不确定性仍然隐藏着。现在,随着更多现实世界的因素被纳入,这些因素中固有的不确定性显现出来并被添加到模型中。因此,你面临着一个具有讽刺意味的权衡;当你的模型努力更好地反映现实世界时,它们也变得更加不确定。这就像在流沙中游泳;你越努力挣脱出来,就陷得越深。
关于支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
这种困境在计算化学和生物学领域并非闻所未闻。例如,我们目前用于预测蛋白质-药物相互作用的许多模型都非常简单,但仍然足够准确以至于有用。几个原因解释了这种出乎意料的准确性;其中包括误差抵消(费米原理)、训练集与测试集的相似性,有时仅仅是运气。训练集和测试集的相似性尤其意味着你的模型在解释方面可能相当出色,但在预测甚至稍微不同的系统时可能会崩溃。此外,误差分析不幸地不是大多数这些研究的优先事项,因为重点是发表正确的结果。除非这种文化改变,否则我们实现准确预测的道路将异常缓慢。
这里有一个来自我自身领域的例子,说明“更多可能会更糟”。在过去的几个月中,我一直在使用一个非常简单的模型来尝试预测类药物分子穿过细胞膜的扩散。这是药物开发中的一个重要问题,因为即使你最出色的试管候选药物,在进入细胞之前也将毫无价值。细胞膜是疏水的(憎水的),而周围的水是亲水的(喜水的)。潜在药物从周围的水转移到膜中的容易程度取决于其溶剂化能等因素,即药物能够多容易地摆脱水分子;溶剂化能越小,药物就越容易穿过。
我使用的模型中的基本假设之一是分子在水和膜中都只存在一种构象。分子的构象就像人类的瑜伽姿势;具有许多可旋转键的典型有机分子通常具有数千种可能的构象。单一构象的假设从根本上是错误的,因为在现实中,分子是高度灵活的生物,它们在水和细胞膜内部的几种构象之间相互转化。为了克服这种假设,一篇最近的论文明确计算了分子在水中的构象,并将这一因素纳入扩散预测中。这当然更现实。令作者惊讶的是,他们发现使计算更现实反而使预测变得更糟。虽然造成这种失败的确切因素组合可能很难理清,但可能发生的情况是,更现实的因素也带来了更多的噪声和不确定性。这种不确定性会累积,以前可能抵消的误差不再抵消,整个预测变得更加模糊和不太有用。
我认为这部分是气候模型中正在发生的事情。在模型中包含更多现实生活中的因素并不意味着所有这些因素都得到很好的理解或精确的测量。你不可避免地引入了一些已知的未知因素。理解不足的因素会引入更多的不确定性。理解良好的因素会引入较少的不确定性。最终,模型的准确性将取决于这两种因素之间的相互作用,而目前看来,新因素的纳入速度高于准确计算或测量这些因素的速度。
文章接着指出,尽管存在这种日益增长的不确定性,但气候模型的基本预测在总体上是一致的。然而,文章也承认难以向公众解释日益增长的不确定性,自 2007 年(上次 IPCC 报告发布时)以来,公众对气候变化的怀疑态度有所增加。作为一名化学建模者,我可以同情气候建模者。
但是,从这种困境中吸取的教训是,粗糙的模型有时比更现实的模型效果更好。我最喜欢的关于模型的名言来自统计学家乔治·博克斯,他说“所有模型都是错误的,但有些模型是有用的”。努力使模型更现实是一项值得称赞的事业,但使其有用更为重要。
注:作为一个顺便的想法,值得指出的是,一些常见问题可能会严重限制任何类型模型的用途,无论是用于预测股票市场、全球气候还是药物、蛋白质和基因的行为
1. 过拟合:你使模型非常完美地拟合现有数据,以至于模型成为自身成功的受害者。它在解释已知事物方面非常出色,但它过度依赖于每个数据点,以至于略微不同的数据分布完全压倒了其预测能力。
2. 异常值:另一方面,如果你只拟合少量数据点而忽略异常值,那么当面对“富含”异常值的数据集时,你的模型再次面临失败的风险。
3. 普遍性与特殊性:如果你构建一个预测平均行为的模型,那么它可能在预测特定情况下会发生什么时几乎没有用处。如果你愿意,可以称之为统计学本身的祸根,但这确实使预测变得更加困难。
4. 近似值:这可能是每个模型固有的一个局限性,因为每个模型都基于近似值,没有这些近似值,模型就会过于复杂而无法使用。诀窍在于知道应该采用哪些近似值,应该忽略哪些近似值,并进行足够的测试以确保忽略的近似值仍然允许模型解释大部分数据。近似值也常常是由权宜之计决定的,因为即使模型在理论上可以包含每个参数,但在计算机时间或成本方面也可能变得过高。有很多充分的理由进行近似,只要你始终记住你已经这样做了。
这是对The Curious Wavefunction博客上一篇帖子的更新和修订版本。