[数学] 方差和标准差
均值:
方差的定义:
标准差:
第一组 | 身高cm | | x-\(\mu\) | | \((x-\mu)^2\) | 第二组 | 身高cm | | x-\(\mu\) | | \((x-\mu)^2\) |
---|---|---|---|---|---|---|---|
A1 | 188 | 10 | 100 | A2 | 166 | 12 | 144 |
B1 | 169 | 9 | 81 | B2 | 175 | 3 | 9 |
C1 | 173 | 5 | 25 | C2 | 176 | 2 | 4 |
D1 | 175 | 3 | 9 | D2 | 178 | 0 | 0 |
E1 | 185 | 7 | 49 | E2 | 182 | 4 | 16 |
F1 | 178 | 0 | 0 | F2 | 191 | 13 | 169 |
\(\sum=1068\) | \(\sum=34\) | \(\sum=264\) | \(\sum=1068\) | \(\sum=34\) | \(\sum=342\) | ||
均值\(\mu=1068/8=178\) | 方差\(\sigma=264/6=44\) | 均值\(\mu=1068/6=178\) | 方差\(\sigma=342/6=57\) | ||||
标准差\(std=\sqrt{44}=6.63\) | 标准差\(std=\sqrt{57}=7.55\) |
从上面的两组数字可以看到:
- 两组的身高总和一样:1068cm
- 两组的平均值一样:178cm
- 两组的差的绝对值的和一样:34
- 第一组的身高比较接近,因此方差为44
- 第二组的身高相差悬殊,因此方差为57
平方计算可以放大远离平均值的异常值。
数学期望
1.数学期望的定义
在概率论和统计学中,数学期望(或均值)是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一。它反映随机变量平均取值的大小。
随机变量包括离散型和连续型,数学期望的计算也分离散型和连续型。
(1)离散型
如果随机变量只取得有限个值或无穷能按一定次序一一列出,其值域为一个或若干个有限或无限区间,这样的随机变量称为离散型随机变量。
(2)连续型
若随机变量X的分布函数F(x)可表示成一个非负可积函数f(x)的积分,则称X为连续型随机变量,f(x)称为X的概率密度函数(分布密度函数)。
- 计算公式
设离散型随机变量X的分布律 \(P(X=x_k)=p_k, k=1,2,...\), \(x_k\)为第k个值,\(p_k\)为第k个值出现的概率。
- 例子
52张扑克牌,其中有4张A,抽中A得10元,否则输1元。求赢钱的数学期望。
抽中A的概率 \(P(isA) = 4/52= \frac{1}{13}\)
没抽中A的概率 \(P(isNotA) = (52-4)/52= \frac{12}{13}\)
赢钱期望E = \(\frac{1}{13} * 10 + \frac{12}{13} * (-1) = \frac{-2}{13}\)
即 赢钱期望E小于0。
均值mean,统计学概念,是在你有一定量的数据后,加权平均后计算出的数值。
期望E(Expected),概率论概念,是在你对随机变量的概率进行估计后,求出的预期数值。
均值有权重,期望有概率,在日常生活中,很多时候我们可以粗略地把他们看成同一个概念。
举个例子:你要统计你们班男生的身高,假设你们班有10个男生,以下是你收集到的数据:
170,172,175,176,172,176,176,175,172,176
那么,均值=(170+172+175+176+172+176+176+175+172+176)/10=174cm
同时,我们可以看到,170出现了1次,175出现了2次,172出现了3次,176出现了4次,
加权平均值:170x(1/10)+175x(2/10)+172x(3/10)+176x(4/10)=174
可以看到,均值和加权平均值的计算结果一致,因为均值计算是加权均值计算的一种特殊形式
期望=170X(1/10)+175X(2/10)+172X(3/10)+176X(4/10)=174cm
方差\(var = (170-174)^2*0.1 + (175-174)^2*0.2 + (172-174)^2*0.3 + (176-174)^2)*0.4 = 4.6\)
标准差 $std = \sqrt{var} = \sqrt{4.6} = 2.14 cm
注意方差没有单位,标准差有单位。