本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点
假设你有一些数字,并且想要生成一个数字来代表它们的典型值。如果你学过一点数学或统计学,你可能会想到均值——确切地说是算术平均值。将这些数字加在一起,然后除以你拥有的数字个数。就这么简单。
但也许你有点像 Chidi,而且更糟糕的是,你在某个时候了解了几何平均值。几何平均值是统计学家所说的另一种集中趋势的度量。几何平均值就像算术平均值,但你将加法变为乘法,将除法变为开根号。要找到两个数字的几何平均值,将它们相乘,然后取其乘积的平方根。(此运算只能对两个都为正数或都为负数的数字执行。但世界已经够负面的了。我们只考虑正数!)名副其实,这个均值有一个很好的几何解释:它是边长与以你的两个数字为边长的矩形面积相同的正方形的边长。要找到许多数字(假设是n个)的几何平均值,将它们全部相乘,然后开n次方根。
了解了算术平均值和几何平均值,你陷入了内心的挣扎:哪个均值最能代表你的数字?
支持科学新闻报道
如果你喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
算术平均值很好。它看起来非常平衡和公平。但几何平均值也有其优点。当您处理乘法而非加法过程(如利率)时,它是一个有用的工具。无论您是取两个数字还是许多数字的几何平均值,它都比算术平均值更能将较大的数字拉近较小的数字。对于具有许多较小值和少数较大值的数据集(例如,收入分配),几何平均值可能比算术平均值甚至中位数更能代表数据。
到底选哪个好呢?做决定真难!
为什么不都选呢?
算术-几何平均值让您在您最喜欢的两个正数之间找到一个数字,它是算术平均值和几何平均值之间的折衷,让您内心的 Chidi 可以安心。
找到算术-几何平均值是一个迭代过程。每个步骤都会生成两个数字:前两个数字的算术平均值和几何平均值。因此,从 1 和 2 开始,第一步生成两个数字 3/2 和 √2。在下一步中,您找到 3/2 和 √2 的算术平均值,约为 1.457,以及 3/2 和 √2 的几何平均值,约为 1.456。在那时,您获得的两个值已经非常接近,随后的迭代将产生两个任意接近的数字。在此过程中产生的算术平均值和几何平均值的极限是相同的,因此它被称为算术-几何平均值。1 和 2 的算术-几何平均值为 1.45679…;有点令人失望的是,如果它以 1.456789 开头会更有趣,但无论如何,这是一个令人满意的答案。
两个数字的算术-几何平均值的近似值非常快地接近在一起,因此该过程已被用于找到无理数的良好近似值,如这篇关于如何使用它来近似 π 的论文中所述。
如果你有超过两个数字怎么办?据我所知,没有人定义过任意一组正数的算术-几何平均值,但这并没有阻止我。我不打算将推广后的均值称为算术-几何平均值,以确保没有人认为这是一个“官方”数学术语。相反,我将其称为 ditherer 均值。
对于两个数字的算术-几何平均值,我们有一个迭代过程,每一步都给我们两个数字。一种思考方式是,我们将最小的数字替换为前一个数字的几何平均值,将最大的数字替换为它们的算术平均值。对于 ditherer 均值,我们将做同样的事情。
要取 n 个数字的 ditherer 均值,我们需要一个迭代过程,每一步都给我们 n 个数字。因此,在每一步中,我们将前一个数字列表中的最小数字替换为前一个数字的几何平均值,将最大的数字替换为这些数字的算术平均值。
让我们看一下一组 4 个数字,以了解该过程是如何工作的。我们将从数字 1、5、20 和 26 开始。这些数字的算术平均值为 13,几何平均值约为 7.14。因此,我们用 13 和 7.14 替换我们第一个列表中的最大和最小数字。现在我们有了数字 5、7.14、13 和 20。我们重复这个过程。这四个数字的算术平均值约为 11.285。几何平均值约为 9.82。现在我们的列表是 7.14、9.82、11.285 和 13。算术平均值为 10.31,几何平均值为 10.07。继续:9.82、10.07、10.31、11.285。然后是 10.07、10.31、10.35、10.37。有进展!再迭代几次,很明显这些数字越来越接近,最终接近 10.3。
两个数字的算术-几何平均值一直是数学中一个有用的概念。产生它的迭代过程收敛速度非常快,因此已被用于快速准确地计算近似值,如这篇关于使用算术-几何平均值计算 π 的论文中所述。据我所知,数学家尚未发现 ditherer 均值的用途,但我希望它能帮助一些优柔寡断的人计算平均值并继续他们的生活。
这就是你所拥有的:现在你可以找到一组正数的平均值,而无需在它们的算术平均值和几何平均值之间做出选择。数学总是给你一个整洁的答案,没有不确定性或歧义,这难道不美妙吗?