CSS Ribbon

Reproducing the GitHub Ribbon in CSS

【统计学】6.统计量及其抽样分布

【统计学】6.统计量及其抽样分布

6.1 统计量
6.2 抽样分布
6.3 样本均值的分布与中心极限定理
6.4 由正态分布导出的几个重要分布

学习目标

1.了解统计量及其分布的几个概念
2.了解由正态分布导出的几个重要分布
3.理解样本均值的分布与中心极限定理
4.掌握单样本比例和样本方差的抽样分布

6.1 统计量

6.1.1 统计量的概念

统计量(statistic)

\[X_1,X_2,...,X_n \]

是从总体X中抽取的容量为n的一个样本,如果由次样本构造一个函数

\[T(X_1,X_2,...,X_n) \]

不依赖于任何未知参数,则称函数

\[T(X_1,X_2,...,X_n) \]

是一个统计量

样本均值、样本比例、样本方差等都是统计量

  1. 统计量是样本的一个函数
  2. 统计量是统计推断的基础
6.1.2 常用统计量

(1)样本均值

\[\overline X = \frac{1}{n}\sum^n_{i=1}X_i \]

(2)样本方差

\[S^2 = \frac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2 \]

(3)样本变异系数

\[V = S \sqrt{X} \]

(4)k阶矩

\[m_k = \frac{1}{n}\sum^n_{i=1}X^k_i \]

(5)k阶中心矩

\[v_k = \frac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^k \]

(6)样本偏度

\[\alpha_3 =\frac{ \sqrt{n-1}\sum^n_{i=1}(X_i-\overline X)^3}{\sum^n_{i=1}(X_i-\overline X)^{\frac{3}{2}}} \]

(7)样本峰度

\[\alpha_4 = \frac{n-1\sum^n_{i=1}(X_i-\overline X)^4}{[\sum^n_{i=1}(X_i-\overline X)^2]^2}-3 \]

6.2 抽样分布(sampling distribution)

  1. 样本统计量的概率分布,是一种理论分布
    1. 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布
  2. 随机变量是样本统计量
    1. 样本均值、样本比例、样本方差等
  3. 结果来自容量相同的所有可能样本
  4. 提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据

6.3 样本均值的分布与中心极限定理

样本均值的抽样分布

  1. 在重复容量为n的样本时,由样本均值的多有可能取值形成的相对频数分布
  2. 一种概率分布
  3. 推断总体均值μ的理论基础

当总体服从正态分布

\[N(\mu,\sigma^2) \]

来自该总体的所有容量为n的样本的均值

\[\overline x \]

也服从正态分布,

\[\overline x \]

的数学期望为

\[\mu \]

方差为

\[\frac{\sigma^2}{n} \]

\[\overline x \backsim N(\mu,\frac{\sigma^2}{n}) \]

中心极限定理(central limit theorem)

【统计学】中心极限定理

从均值为μ,方差为

\[\sigma^2 \]

的任意一个总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ,方差为

\[\frac{\sigma^2}{n} \]

的正态分布

【统计学】中心极限定理趋向分布

6.4 由正态分布推导出来的几个重要分布

卡方分布
  1. 有阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Person)分别于1875年和1900年推导出来

  2. \[X \backsim N(\mu,\sigma^2) \]

    \[z = \frac{X-\mu}{\sigma} \backsim N(0,1) \]

  3. \[Y = z^2 \]

    则Y服从自由度为1的卡方分布,即

    \[Y \backsim \chi^2(1) \]

  4. 当总体

    \[X \backsim N(\mu,\sigma^2) \]

    从中抽取容量为n的样本,则

    \[\frac{\sum^2_{i=1}(x_i-\overline x)^2}{\sigma^2} \backsim \chi^2(n-1) \]

卡方分布的性质和特点

  1. 分布的变量始终为正
  2. 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称
  3. 期望为

\[E(\chi^2) = n \]

方差为

\[D(\chi^2) = 2n \]

其中n为自由度

  1. 可加性:若U和v为两个独立的卡方分布随机变量,

\[U \backsim \chi^2(n_1),V \backsim \chi^2(n_2) \]

\[U+V \]

这一随机变量服从自由度为

\[n_1+n_2 \]

的卡方分布

【统计学】卡方分布

t分布
  1. 高赛特(W.S.Gosset)于1908年在一篇以"student"为笔名的论文中首次提出
  2. t 分布式类似正态分布的一种对称分布,它通常要比正态分布平坦和分散
  3. 一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布

【统计学】t分布

F分布
  1. 由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名

  2. 设若U为服从自由度为n1的卡方分布,即

    \[U \backsim \chi^2(n_1) \]

    V为服从自由度为n2的卡方分布,即

    \[V \backsim \chi^2(n_2) \]

    且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为

    \[F = \frac{\frac{U}{n_1}}{\frac{V}{n_2}} \]

    \[F \backsim F(n_1,n_2) \]

    【统计学】F分布

例题

例题 1

设从一个均值μ=10,标准差sigma=0.6的总体中随机选取容量n=36的样本。假定该总体不是很偏,要求:

  1. 样本均值小于9.9的近似概率

    n=36说明是大样本,则该样本均值是满足

    \[\overline x \backsim N(10,\frac{0.6^2}{36}) = N(\mu,\sigma^2) \\ \mu = 10 ,\sigma = 0.1 \]

    先进行标准化

    \[P(\overline x <9.9) = P(\frac{\overline x -10}{0.1}<\frac{9.9-10}{0.1}) \\ \phi(-1) = 1- \phi(1) = 1-0.8413 = 0.1587 \]

  2. 样本均值超过9.9的近似概率

\[P(\overline x >9.9) = P(Z>-1) = \phi(1) = 0.8413 \]

  1. 样本均值在总体均值10附近0.1范围的概率

\[P(9.9< \overline x <10.1) = P(-1<Z<1) = 2\phi(1) -1 = 0.6826 \]

例题2

某汽车电瓶生产商称其生产的电瓶均有均值为60个月,标准差为6个月的寿命分布。现假设质检部门决定检验该厂的说法是否正确,为此随机抽取了50个该厂生产的电瓶进行寿命试验

  1. 假定厂方声称是正确的,试描述50个电瓶的平均寿命的抽样分布

    \[\overline X \backsim N(60,\frac{36}{50}) \]

  2. 假定厂方声称是正确的,试描述50个样本组成的样本的平均寿命不超过57个月的概率

\[P(\overline X \leq 57) = P(\frac{\overline X -60}{\sqrt{0.72} }\leq \frac{57-60}{\sqrt{0.72}}) \\= 1 - \phi(3.529) = 1-0.9998 = 0.0002 \]

例题3

\[Z_1,Z_2,...Z_6 \]

表示从标准正态总体中随机抽取的容量为n=6的一个样本,试确定常数b,使得,

\[P(\sum^6_{i=1}Z^2_i \leq b) = 0.95 \]

这是一个小样本,总体服从正态分布则

\[Z_i \backsim N(0,1) \]

\[P(\chi^2_{6} \leq b) = 0.95 \\ P(\chi^2_{6} > b) = 0.05 \\ b = 12.592 \]

posted on 2021-05-12 14:47  pandaboy1123  阅读(1211)  评论(0编辑  收藏  举报

导航