08 假设检验 | 概率论与数理统计
1. 假设检验
1. 假设检验问题
-
假设
- 零假设(原假设)\(H_0: \mu = \mu_0\)
- 备择假设(备选假设)\(H_1: \mu\ne\mu_0\)
-
实际推断原理:由于要检验的假设涉及总体均值\(\mu\),因此借助\(\mu\)的无偏估计量\(\overline{x}\)这一统计量来进行判断
-
拒绝域:可适当选定一正数\(k\),使当观察值\(\overline{x}\)满足\(\frac{|\overline{x} - \mu_0|}{\sigma/\sqrt{n}}\ge k\),就拒绝假设\(H_0\);为了确定常数\(k\),我们考虑统计量,当\(H_0\)成立时,\(\frac{|\overline{x} - \mu_0|}{\sigma/\sqrt{n}}\sim N(0, 1)\),当\(H_0\)成立时,\(|\frac{\overline{x} - \mu_0}{\sigma/\sqrt{n}}|>z_{\alpha/2}\)是概率为\(\alpha\)的小概率事件;则当统计量\(z = \frac{\overline{x} - \mu_0}{\sigma / \sqrt{n}}\)进入\((-\infty, -z_{\alpha/2}]\cup[z_{\alpha / 2}, +\infty)\)区域, 就决策否定\(H_0\),这个区域就叫 拒绝域
-
假设检验的基本思想:实质上是带有某种概率性质的反证法。为了检验一个假设\(H_0\)是否正确,首先假定该假设\(H_0\)正确,然后根据抽取到的样本对假设\(H_0\)作出接受或者拒绝的决策,如果样本观察值导致了不合理的现象发生, 就应拒绝假设\(H_0\),否则应接受假设\(H_0\)
-
两类错误
- 第一类错误(弃真):当\(H_0\)为真的时候拒绝\(H_0\)
- 第二类错误(取伪):当\(H_0\)为假的时候接受\(H_0\)
- 记号
- 显著水平:\(\alpha =\) 发生第一类错误的概率
- \(\beta =\) 发生第二类错误的概率
- 当然,我们希望犯两类错误的概率都尽可能的小,在实际问题中, 通常的做法是: 先限制犯第一类错误的概率\(\alpha\),(显著性检验问题)即根据实际情况, 指定一个较小的数\(\alpha\),就可以确定上述的数\(k\), 从而可确定拒绝域
真实情况\所作判断 接受\(H_0\) 拒绝\(H_0\) \(H_0\)为真 正确 第一类错误 \(H_0\)为假 第二类错误 正确
关于零假设与备择假设的选取
在控制犯第一类错误的概率\(\alpha\)的原则下,使得采取拒绝\(H_0\)的决策变得较慎重,即\(H_0\)得到特别的保护
因而,通常把有把握的、有经验的、默认的结论作为原假设, 或者尽可能使后果严重的错误成为第一类错误
2. 假设检验分类
- 双边假设
- 双边备择假设:在\(H_0:\mu = \mu_0\)和\(H_1:\mu\ne\mu_0\)中,备择假设\(H_1\)表示\(\mu\)可能大于\(\mu_0\),也可能小于\(\mu_0\),称为 双边备择假设
- 双边假设检验:形如\(H_0:\mu = \mu_0\)和\(H_1:\mu\ne\mu_0\)的假设检验被称为 双边假设检验
- 单边假设检验
- 分类
- 右边检验:\(H_0:\mu\le\mu_0,H_1:\mu>\mu_0\)
- 左边检验:\(H_0:\mu\ge\mu_0,H_1:\mu<\mu_0\)
- 拒绝域(显著性水平为\(\alpha\))
- 右边检验:\(z\ge z_{\alpha}\)
- 左边检验:\(z\le -z_{\alpha}\)
- 分类
2. 正态总体均值的假设检验
1. 单个总体\(N(\mu, \sigma^2)\)均值\(\mu\)的检验
- \(\sigma^2\)已知:Z检验法,取统计量\(Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}}\)
检验 拒绝域 双边检验 \(H_0:\mu = \mu_0, H_1:\mu\ne\mu_0\) \(\lvert z\rvert >z_{\alpha/2}\) 左边检验 \(H_0:\mu \ge \mu_0, H_1:\mu<\mu_0\) \(z\le-z_{\alpha}\) 右边检验 \(H_0:\mu\le\mu_0, H_1:\mu>\mu_0\) \(z\ge z_{\alpha}\) - \(\sigma^2\)未知:t检验法:当\(H_0\)为真的时候,\(\frac{\overline{X} - \mu_0}{s/\sqrt{n}}\sim t(n - 1)\),取统计量\(t = \frac{\overline{X} - \mu_0}{s / \sqrt{n}}\)
检验 拒绝域 双边检验 \(H_0:\mu = \mu_0, H_1:\mu\ne\mu_0\) \(\lvert t\rvert >t_{\alpha/2}(n-1)\) 左边检验 \(H_0:\mu \ge \mu_0, H_1:\mu<\mu_0\) \(t\le-t_{\alpha}(n - 1)\) 右边检验 \(H_0:\mu\le\mu_0, H_1:\mu>\mu_0\) \(t\ge t_{\alpha}(n - 1)\)
2. 双总体均值差的检验
- \(\sigma_1^2, \sigma_2^2\)已知:Z体检,取统计量\[Z = \frac{\overline{X} - \overline{Y} - \delta}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \]
检验 拒绝域 双边检验 \(H_0:\mu_1 - \mu_2 = \delta, H_1:\mu_1 - \mu_2\ne\delta\) \(\lvert z\rvert >z_{\alpha/2}\) 左边检验 \(H_0:\mu_1 - \mu_2 \ge \delta, H_1:\mu_1 - \mu_2 < \delta\) \(z\le-z_{\alpha}\) 右边检验 \(H_0:\mu_1 - \mu_2 \le \delta, H_1:\mu_1 - \mu_2 > \delta\) \(z\ge z_{\alpha}\) - \(\sigma_1^2 = \sigma_2^2\)未知:t检验,取统计量\[t = \frac{(\overline{X} - \overline{Y}) - \delta}{S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\sim t(n_1 + n_2 - 2), S_w^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2} \]
检验 拒绝域 双边检验 \(H_0:\mu_1 - \mu_2 = \delta, H_1:\mu_1 - \mu_2\ne\delta\) \(\lvert t\rvert >t_{\alpha/2}(n_1 + n_2 - 2)\) 左边检验 \(H_0:\mu_1 - \mu_2 \ge \delta, H_1:\mu_1 - \mu_2 < \delta\) \(t\le-t_{\alpha}(n_1 + n_2 - 2)\) 右边检验 \(H_0:\mu_1 - \mu_2 \le \delta, H_1:\mu_1 - \mu_2 > \delta\) \(t\ge t_{\alpha}(n_1 + n_2 - 2)\)
3. 基于成对数据的检验(\(t\)检验)
- 给定两组数据,计算出各组数据的数据差\(d_i = x_i - y_i\),设\(D_i = X_i - Y_i\)来自正态总体\(N(\mu_D, \sigma_D^2)\),这里\(\mu_D, \sigma_D^2\)均为未知,随机误差\(d_i\)可以认为服从正态分布,其均值为零。需检验假设\(H_0:\mu_D = 0, H_1:\mu_D\ne 0\),拒绝域\(|t| = |\frac{\overline{d} - 0}{s_D / \sqrt{n}}|\ge t_{\alpha/2}(n - 1)\)
3. 正态方差的假设检验
1. 单个总体\(N(\mu, \sigma^2)\)方差\(\sigma^2\)的检验(\(\chi^2\)检验法)
- 设总体\(X\sim N(\mu, \sigma^2)\),\(\mu, \sigma\)未知,\(X_1, X_2, \dots, X_n\)是来自\(X\)的样本,给定显著性水平\(\alpha\)
- \(\sigma^2\)的检验问题:\(\chi^2\)检验法:取统计量\(\chi^2 = \frac{(n - 1)S^2}{\sigma_0^2}\)
检验 拒绝域 双边检验 \(H_0:\sigma^2 = \sigma^2_0, H_1:\sigma^2\ne\sigma^2_0\) \(\chi^2\le\chi_{1- \alpha/2}^2(n-1)\cup\chi^2\ge\chi_{\alpha/2}^2(n-1)\) 左边检验 \(H_0:\sigma^2 \ge \sigma^2_0, H_1:\sigma^2<\sigma^2_0\) \(\chi^2\le\chi_{1- \alpha}^2(n-1)\) 右边检验 \(H_0:\sigma^2\le\sigma^2_0, H_1:\sigma^2>\sigma^2_0\) \(\chi^2\ge\chi_{\alpha}^2(n-1)\)
2. 双总体方差的检验(\(F\)检验)
- 取检验统计量\(F = \frac{S_1^2}{S_2^2}\sim F(n_1 - 1, n_2 - 1)\)
检验 拒绝域 双边检验 \(H_0:\sigma_1^2 = \sigma^2_2, H_1:\sigma_1^2\ne\sigma^2_2\) \(F\le F_{1- \alpha/2}(n_1-1, n_2 - 1)\cup F\ge F_{\alpha/2}(n_1-1, n_2 - 1)\) 左边检验 \(H_0:\sigma_1^2 \ge \sigma^2_2, H_1:\sigma_1^2<\sigma^2_2\) $ F\le F_{1- \alpha}(n_1-1, n_2 - 1)$ 右边检验 \(H_0:\sigma_1^2\le\sigma^2_2, H_1:\sigma_1^2>\sigma^2_2\) $ F\ge F_{\alpha}(n_1-1, n_2 - 1)$