Published on

几何平均数

Authors
  • avatar
    Name
    Mao
    Twitter

本文从数学定义、推导过程、应用场景三个维度系统解析几何平均数,并对比其与算术平均数的核心差异。

一、概念定义

几何平均数(Geometric Mean)是n个正实数乘积的n次方根: G=x1×x2××xnnG = \sqrt[n]{x_1 \times x_2 \times \cdots \times x_n}

其本质特征:

  1. 适用于乘积关系数据(如增长率、比例)
  2. 对极端值不敏感
  3. 要求数据均为正数

二、数学推导

1. 对数转换推导:

lnG=1ni=1nlnxi\ln G = \frac{1}{n}\sum_{i=1}^n \ln x_i

通过对数转换将乘积关系转化为线性关系,几何平均数即指数化的对数平均数

2. 与算术平均数关系:

当数据服从对数正态分布时: GXˉG \leq \bar{X}

等号当且仅当所有数据相等时成立

三、使用场景对比

场景特征适用几何平均数适用算术平均数
数据关系乘积关系(如增长率)线性叠加关系
分布形态右偏分布对称分布
数据范围全为正数允许负数
极端值敏感性不敏感敏感

四、典型应用

  1. 金融投资:计算复合收益率

    • 例:3年收益率分别为10%, 20%, -5%

    G=1.1×1.2×0.95317.8%G = \sqrt[3]{1.1 \times 1.2 \times 0.95} - 1 \approx 7.8\%

  2. 数据归一化:消除量纲差异

    • 例:比较不同量纲指标时,使用几何平均保持比例关系
  3. 图像处理:Gamma校正

    G=R×G×BG = \sqrt{R \times G \times B}

    保持色彩平衡

  4. 环境科学:污染物浓度评估

    • 更准确反映长期暴露水平

五、局限与注意事项

  1. 零值陷阱:数据含零时结果为0
  2. 负值限制:无法处理负数
  3. 解释难度:结果不如算术平均直观

理解这些特性后,在分析右偏分布(如收入数据)、处理比例变化(如物价指数)时,几何平均数能提供更准确的集中趋势度量。而对称分布数据(如温度测量)则更适合使用算术平均数。