为什么“总体方差 ≠ 偏样本方差”？

Ciallo～(∠・ω< )⌒★ 我是赤川鹤鸣！这一次是在推导强化学习公式的时候遇到的一个式子的转换，由此延伸出了总体方差和偏样本方差的区别.

已知样本均值 $ \bar{x} = \frac{1}{n} \sum_{i=1}^n x_i $，偏样本方差 $\sigma_{x}^2 = \frac{1}{n} \sum_{i=1}^n \left( x_{i} - \bar{x} \right)^2$，总体方差 $s^2 = \frac{1}{n} \sum_{i=1}^n \left( x_{i} - \mu \right)^2$

试证明

\[s^2 = \sigma_x^{2} + \left( \bar{x} - \mu\right)^2 \]

原式可化为

\[\dfrac{1}{n} \sum_{i=1}^n \left( x_{i} - \mu \right)^2 = \dfrac{1}{n} \sum_{i=1}^n \left( x_{i} - \bar{x} \right)^2 + \left( \bar{x} - \mu \right)^2 \tag{1} \]

两侧同时乘 $n$，得

\[\sum_{i=1}^n \left( x_{i} - \mu \right)^2 = \sum_{i=1}^n \left( x_{i} - \bar{x} \right)^2 + n \left( \bar{x} - \mu \right)^2 \tag{2} \]

令

\[A = \sum_{i=1}^n \left( x_{i} - \mu \right)^2 - \sum_{i=1}^n \left( x_{i} - \bar{x} \right)^2 - n \left( \bar{x} - \mu \right)^2 \tag{3} \]

只需要证明 $A=0$ 即可.

将 $(3)$ 中的乘方打开，得

\[A = \sum_{i=1}^{n} x_i^2 - 2 \mu \sum_{i=1}^{n} x_i + n\mu^2 - \sum_{i=1}^{n} x_i^2 + 2\bar{x} \sum_{i=1}^{n} x_i - n \bar{x}^2 - n \left( \bar{x} - \mu \right)^2 \tag{4} \]

将 $(4)$ 中的 $\sum_{i=1}^{n} x_i^2$ 抵消，得

\[A = - 2 \mu \sum_{i=1}^{n} x_i + n\mu^2 + 2\bar{x} \sum_{i=1}^{n} x_i - n \bar{x}^2 - n \left( \bar{x} - \mu \right)^2 \tag{5} \]

将 $(5)$ 中的乘方进一步打开，合并同类项，得

\[\begin{aligned} A &= - 2 \mu \sum_{i=1}^{n} x_i + n\mu^2 + 2\bar{x} \sum_{i=1}^{n} x_i - n \bar{x}^2 - n \bar{x}^2 + 2 n \bar{x} \mu - n \mu^2 \\ &= - 2 \mu \sum_{i=1}^{n} x_i + n\mu^2 + 2\bar{x} \sum_{i=1}^{n} x_i -2 n \bar{x}^2 + 2 n \bar{x} \mu - n \mu^2 \\ &= - 2 \mu \sum_{i=1}^{n} x_i + 2\bar{x} \sum_{i=1}^{n} x_i -2 n \bar{x}^2 + 2 n \bar{x} \mu \end{aligned} \tag{6} \]

又因为 $ \bar{x} = \dfrac{1}{n} \sum_{i=1}^n x_i $，所以代入式子 $(6)$ 得

\[\begin{aligned} A &= -2n\mu \bar{x} + 2n \bar{x} ^2 -2 n \bar{x}^2 + 2 n \bar{x} \mu \\ &= -2n\mu \bar{x} + 2 n \bar{x} \mu \\ &= 0 \end{aligned} \tag{7} \]

证明完毕.

这说明通常情况下，总体方差不等于偏样本方差，它们之间的误差是 $\left( \bar{x} - \mu\right)^2$.

posted @ 2024-12-12 15:40 赤川鹤鸣阅读(36) 评论(0) 编辑收藏举报

刷新页面返回顶部

AkagawaTsurunaki

为什么“总体方差 ≠ 偏样本方差”？

为什么“总体方差 ≠ 偏样本方差”？

公告