期望、方差、协方差及相关系数的基本运算

转载位置：http://blog.codinglabs.org/articles/basic-statistics-calculate.html

这篇文章总结了概率统计中期望、方差、协方差和相关系数的定义、性质和基本运算规则。

期望

定义

设 $P (x)$

E (x) = \sum k = 1 n x k P (x k)

设 $p (x)$

E (x) = \int + \infty - \infty x p (x) d x

性质

1、线性运算规则

期望服从线性性质（可以很容易从期望的定义公式中导出）。因此线性运算的期望等于期望的线性运算：

E (a x + b y + c) = a E (x) + b E (y) + c

这个性质可以推广到任意一般情况：

E (\sum k = 1 n a i x i + c) = \sum k = 1 n a i E (x i) + c

2、函数的期望

设 $f (x)$

离散：

E (f (x)) = \sum k = 1 n f (x k) P (x k)

连续：

E (f (x)) = \int + \infty - \infty f (x) p (x) d x

一定要注意，函数的期望不等于期望的函数，即 $E (f (x)) \neq f (E (x))$

3、乘积的期望

一般来说，乘积的期望不等于期望的乘积，除非变量相互独立。因此，如果x和y相互独立，则 $E (x y) = E (x) E (y)$

期望的运算构成了统计量的运算基础，因为方差、协方差等统计量本质上是一种特殊的期望。

方差

定义

方差是一种特殊的期望，被定义为：

V a r (x) = E ((x - E (x)) 2)

性质

1、展开表示

反复利用期望的线性性质，可以算出方差的另一种表示形式：

V a r (x) = = = = = E ((x - E (x)) 2)

2、常数的方差

常数的方差为0，由方差的展开表示很容易推得。

3、线性组合的方差

方差不满足线性性质，两个变量的线性组合方差计算方法如下：

V a r (a x + b y) = a 2 V a r (x) + b 2 V a r (y) + 2 C o v (x, y)

其中 $C o v (x, y)$

4、独立变量的方差

如果两个变量相互独立，则：

V a r (a x + b y) = a 2 V a r (x) + b 2 V a r (y)

作为推论，如果x和y相互独立： $V a r (x + y) = V a r (x) + V a r (y)$

协方差

定义

两个随机变量的协方差被定义为：

C o v (x, y) = E ((x - E (x)) (y - E (y)))

因此方差是一种特殊的协方差。当x=y时， $C o v (x, y) = V a r (x) = V a r (y)$

性质

1、独立变量的协方差

独立变量的协方差为0，可以由协方差公式推导出。

2、线性组合的协方差

协方差最重要的性质如下：

C o v (\sum i = 1 m a i x i, \sum j = 1 n b j y j) = \sum i = 1 m

很多协方差的计算都是反复利用这个性质，而且可以导出一些列重要结论。

作为一种特殊情况：

C o v (a + b x, c + d y) = b d C o v (x, y)

另外当x=y时，可以导出方差的一般线性组合求解公式：

V a r (\sum k = 1 n a i x i) = \sum i = 1 n \sum j = 1 n a i a

似水流年

期望、方差、协方差及相关系数的基本运算

期望

定义

性质

方差

定义

性质

协方差

定义

性质

相关系数

定义

性质

公告