【统计学】6.统计量及其抽样分布
【统计学】6.统计量及其抽样分布
6.1 统计量
6.2 抽样分布
6.3 样本均值的分布与中心极限定理
6.4 由正态分布导出的几个重要分布
学习目标
1.了解统计量及其分布的几个概念
2.了解由正态分布导出的几个重要分布
3.理解样本均值的分布与中心极限定理
4.掌握单样本比例和样本方差的抽样分布
6.1 统计量
6.1.1 统计量的概念
统计量(statistic)
- 设
\[X_1,X_2,...,X_n \]是从总体X中抽取的容量为n的一个样本,如果由次样本构造一个函数
\[T(X_1,X_2,...,X_n) \]不依赖于任何未知参数,则称函数
\[T(X_1,X_2,...,X_n) \]是一个统计量
样本均值、样本比例、样本方差等都是统计量
- 统计量是样本的一个函数
- 统计量是统计推断的基础
6.1.2 常用统计量
(1)样本均值
\[\overline X = \frac{1}{n}\sum^n_{i=1}X_i \](2)样本方差
\[S^2 = \frac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2 \](3)样本变异系数
\[V = S \sqrt{X} \](4)k阶矩
\[m_k = \frac{1}{n}\sum^n_{i=1}X^k_i \](5)k阶中心矩
\[v_k = \frac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^k \](6)样本偏度
\[\alpha_3 =\frac{ \sqrt{n-1}\sum^n_{i=1}(X_i-\overline X)^3}{\sum^n_{i=1}(X_i-\overline X)^{\frac{3}{2}}} \](7)样本峰度
\[\alpha_4 = \frac{n-1\sum^n_{i=1}(X_i-\overline X)^4}{[\sum^n_{i=1}(X_i-\overline X)^2]^2}-3 \]
6.2 抽样分布(sampling distribution)
- 样本统计量的概率分布,是一种理论分布
- 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布
- 随机变量是样本统计量
- 样本均值、样本比例、样本方差等
- 结果来自容量相同的所有可能样本
- 提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据
6.3 样本均值的分布与中心极限定理
样本均值的抽样分布
- 在重复容量为n的样本时,由样本均值的多有可能取值形成的相对频数分布
- 一种概率分布
- 推断总体均值μ的理论基础
当总体服从正态分布
\[N(\mu,\sigma^2) \]来自该总体的所有容量为n的样本的均值
\[\overline x \]也服从正态分布,
\[\overline x \]的数学期望为
\[\mu \]方差为
\[\frac{\sigma^2}{n} \]即
\[\overline x \backsim N(\mu,\frac{\sigma^2}{n}) \]中心极限定理(central limit theorem)
从均值为μ,方差为
\[\sigma^2 \]的任意一个总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ,方差为
\[\frac{\sigma^2}{n} \]的正态分布
6.4 由正态分布推导出来的几个重要分布
卡方分布
有阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Person)分别于1875年和1900年推导出来
设
\[X \backsim N(\mu,\sigma^2) \]则
\[z = \frac{X-\mu}{\sigma} \backsim N(0,1) \]令
\[Y = z^2 \]则Y服从自由度为1的卡方分布,即
\[Y \backsim \chi^2(1) \]当总体
\[X \backsim N(\mu,\sigma^2) \]从中抽取容量为n的样本,则
\[\frac{\sum^2_{i=1}(x_i-\overline x)^2}{\sigma^2} \backsim \chi^2(n-1) \]
卡方分布的性质和特点
- 分布的变量始终为正
- 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称
- 期望为
\[E(\chi^2) = n \]方差为
\[D(\chi^2) = 2n \]其中n为自由度
- 可加性:若U和v为两个独立的卡方分布随机变量,
\[U \backsim \chi^2(n_1),V \backsim \chi^2(n_2) \]则
\[U+V \]这一随机变量服从自由度为
\[n_1+n_2 \]的卡方分布
t分布
- 高赛特(W.S.Gosset)于1908年在一篇以"student"为笔名的论文中首次提出
- t 分布式类似正态分布的一种对称分布,它通常要比正态分布平坦和分散
- 一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布
F分布
由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名
设若U为服从自由度为n1的卡方分布,即
\[U \backsim \chi^2(n_1) \]V为服从自由度为n2的卡方分布,即
\[V \backsim \chi^2(n_2) \]且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为
\[F = \frac{\frac{U}{n_1}}{\frac{V}{n_2}} \]\[F \backsim F(n_1,n_2) \]
例题
例题 1
设从一个均值μ=10,标准差sigma=0.6的总体中随机选取容量n=36的样本。假定该总体不是很偏,要求:
-
样本均值小于9.9的近似概率
n=36说明是大样本,则该样本均值是满足
\[\overline x \backsim N(10,\frac{0.6^2}{36}) = N(\mu,\sigma^2) \\ \mu = 10 ,\sigma = 0.1 \]先进行标准化
\[P(\overline x <9.9) = P(\frac{\overline x -10}{0.1}<\frac{9.9-10}{0.1}) \\ \phi(-1) = 1- \phi(1) = 1-0.8413 = 0.1587 \] -
样本均值超过9.9的近似概率
\[P(\overline x >9.9) = P(Z>-1) = \phi(1) = 0.8413 \]
- 样本均值在总体均值10附近0.1范围的概率
例题2
某汽车电瓶生产商称其生产的电瓶均有均值为60个月,标准差为6个月的寿命分布。现假设质检部门决定检验该厂的说法是否正确,为此随机抽取了50个该厂生产的电瓶进行寿命试验
-
假定厂方声称是正确的,试描述50个电瓶的平均寿命的抽样分布
\[\overline X \backsim N(60,\frac{36}{50}) \] -
假定厂方声称是正确的,试描述50个样本组成的样本的平均寿命不超过57个月的概率
例题3
表示从标准正态总体中随机抽取的容量为n=6的一个样本,试确定常数b,使得,
这是一个小样本,总体服从正态分布则
\[Z_i \backsim N(0,1) \]\[P(\chi^2_{6} \leq b) = 0.95 \\ P(\chi^2_{6} > b) = 0.05 \\ b = 12.592 \]
posted on 2021-05-12 14:47 pandaboy1123 阅读(1211) 评论(0) 编辑 收藏 举报