样本量的确定与OC函数

在之前的假设检验文章中我们说过，在样本量固定的情况下，第一类错误的减少必然会导致第二类错误的增加。按照之前的例子，原假设依旧是一家馒头店每天卖出100个馒头，现在如果减少第一类错误（也就是减少显著性水平 $α$ ），也就是如果抽样结果是90-110之间都可以认为这家店店每天卖出100个馒头。相比于认为抽样结果是95-105之间才接受这个原假设，显然有更大的概率认为原假设是正确的（接受 $H_0$ 的概率增加），这会导致对应的两种情况原假设为真和原假设为假的概率都增加，对应第二类错误的概率（ $β$ ）增加。
在这里插入图片描述

而在实际应用中，我们通常希望可以同时控制第一类错误和第二类错误的概率，从而使正确率更高，这时候就要求抽样是要选取充足的样本量。如何选取样本量使第二类错误的概率控制在预先的范围里呢？为此我们引入OC函数（施行特征函数）：

定义：如果C为参数 $\theta$ 的某检验问题的一个检验法，那么我们设 $\beta(\theta)=P_\theta(\mathrm{接受} ~ H_0)$ 为检验法C的施行特征函数或者OC函数，图形称为OC曲线。
也就是 $\beta(\theta)$ 是在参数为 $\theta$ 的情况下接受原假设 $H_0$ 的概率。

如果这个检验法的显著性水平为 $\alpha$ ，那么当真值 $\theta \in H_0$ 时， $\beta(\theta)$ 为做出正确判断( 在原假设 $H_0$ 为真时接受原假设 $H_0$ )的概率，如果 $\theta \in H_1$ ，那么这个时候 $\beta(\theta)$ 就是犯了第Ⅱ类错误的概率。对应的 $1-\beta(\theta)$ 就是作出正确判断的概率，我们称现在这个时候的函数 $1-\beta(\theta)$ 为C的功效函数。对于某一个具体的点 $\theta^*\in H_1$ ，这个函数表示它在这个点的功效。也就是作出正确判断的概率

正态总体均值检验法的OC函数

Z检验法

首先来看右边检验。它的假设是 $H_0:\mu \le \mu_0,H_1:\mu > \mu_0$ 。

我们首先推导它的OC函数。我们注意到，在右边检验中，它的拒绝域满足条件为 $\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}\ge z_\alpha$ 。那么对应的OC函数为：
$\beta(\mu)=P_\mu(接受H_0)=P_\mu\left\{\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}<z_\alpha\right\}=P_\mu\left\{\frac{\bar X-\mu}{\sigma/\sqrt{n}}<z_\alpha-\frac{\mu-\mu_0}{\sigma/\sqrt{n}}\right\}=\Phi(z_\alpha-\lambda)$
其中 $\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}$ , $\Phi$ 是正态分布累积函数，有： $\Phi(z_\alpha)=1-\alpha$ .OC函数对应的函数图像如下：

在这里插入图片描述
这个函数有如下的性质

1.为 $\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}$ 的单调递减连续函数
2. $\lim_{\mu \to \mu_0^+}\beta(\mu)=1-\alpha,\lim_{\mu \to \infty}\beta(\mu)=0$ ，这是由概率函数的右连续性决定的

很显然我们希望 $\mu > \mu_0$ 时函数的值都可以降到 $\beta$ 以下，但是因为 $\mu_0$ 这个边界点的存在我们做不到让所有的处于拒绝域的值犯第Ⅱ类错误的概率都很低，因为必然会存在在 $\mu_0$ 附近的 $\mu（\mu > \mu_0）$ 使 $\beta(\mu)$ 几乎等于 $1-\alpha$ .而为了控制第一类错误发生的概率， $\alpha$ 都设置的很小，所以无论样本量 $n$ 多大，对于所有的 $\mu > \mu_0$ ，即真值为 $H_1$ 所规定的任意一点，控制犯第二类错误的概率都很小是不可能的。但是可以让 $\mu > \mu_0$ 时 $\beta(\mu)$ 的值，也就是犯第二类错误的概率可以急剧下降，这样当 $\mu \ge \mu_0+\delta$ 时犯第二类错误的概率 $\beta$ 都可以很小。其中 $\delta$ 是人为给定的，很明显 $\delta$ 越小说明检验法的准确程度越高。

所以最终得到的计算公式为：
$\beta(\mu_0+\delta)=\Phi(z_\alpha-\sqrt{n}\delta/\sigma)\le \beta$
化简可得
$z_\alpha-\sqrt{n}\delta/\sigma \le -z_\beta$

对于左边检验，按照同样的逻辑和步骤，你会发现结果是一样的

从而计算得出Z检验单侧检验的最小样本量计算公式：
$\sqrt{n} \ge \frac{(z_\alpha+z_\beta)\sigma}{\delta}$
这个时候我们就能使得 $\mu \in H_1\mathrm{~ 且~}\mu \ge \mu_0+\delta$ 的时候，它犯第Ⅱ类错误的概率不超过 $\beta$ 。

下面来看双边假设检验。
双边检验问题 $H_0:\mu=\mu_0,H_1:\mu \neq \mu_0$ 的OC函数为：
$\beta(\mu)=P_\mu(接受H_0)=P_\mu\left\{-z_{\alpha/2}<\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}<z_{\alpha/2}\right\}=\Phi(z_{\alpha/2}-\lambda)+\Phi(z_{\alpha/2}+\lambda)-1$
其中 $\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}$ , $\Phi$ 是正态分布累积函数。OC函数对应的函数图像如下：
在这里插入图片描述

在这种情况下，我们需要解超越方程 $\beta=\Phi(z_{\alpha/2}-\sqrt{n}\delta/\sigma)+\Phi(z_{\alpha/2}+\sqrt{n}\delta/\sigma)-1$ 确定n，但是一般来说 $n$ 总是很大的，因此我们可以认为 $\Phi(z_{\alpha/2}+\sqrt{n}\delta/\sigma) \approx 1$ ，也就是说我们只需要满足不等式 $\Phi(z_{\alpha/2}-\sqrt{n}\delta/\sigma) \le \beta$ ，解得 $\sqrt{n} \ge(z_{\alpha/2}+z_\beta)\frac\sigma\delta$ ，这就是Z检验在双侧检验的情况下最小样本量的公式。

t检验法

对于t检验的右侧检验的OC函数为
$\beta(\mu)=P_\mu\left\{\frac{\bar X-\mu_0}{S/\sqrt{n}}<t_\alpha(n-1)\right\}$
其中有：
$\frac{\bar X-\mu_0}{S/\sqrt{n}}=(\frac{\bar X-\mu}{\sigma/\sqrt{n}}+\lambda)/(\frac{S}{\sigma}),\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}$
解出这个具体的值超出了我们所学的内容。但是如果给定了 $\alpha,\beta,\delta$ ，我们查表是可以得到需要的样本量 $n$ 的，这样使得 $\mu \in H_1$ 且 $\frac{\mu-\mu_0}{\sigma} \ge \delta$ 犯第Ⅱ类错误的概率不超过 $\beta$ 。

要注意这里的不等式不再是 $\mu-\mu_0 \ge \delta$ 而是 $\frac{\mu-\mu_0}{\sigma} \ge \delta$

双边检测时，对应的不等式为 $\frac{|\mu-\mu_0|}{\sigma} \ge \delta$

但是在实际的应用中 $\sigma$ 一般是不知道的，这是就没有办法通过 $\delta=\frac{|\mu-\mu_0|}{\sigma}$ 来计算 $\delta$ 并查表得到样本量了。可以按照如下步骤来近似算一下：首先适当的取一个值 $n_1$ ,抽取容量为 $n_1$ 的样本，并根据这一样本计算出 $s^2$ 的值，以 $s^2$ 作为 $\sigma^2$ 的估计值计算得到 $\delta$ 的近似值，代入查表得到 $n_2$ 。如果 $n_1 \ge n_2$ ,则取 $n_1$ 作为样本容量。如果 $n_2$ 更大，那么就抽取 $n_2-n_1$ 个样本补充进原样本，按照一样的步骤计算 $s^2,\delta$ ,然后查表得到 $n_3$ ，若 $n_2 \ge n_3$ ,则取 $n_2$ 作为样本容量,否则继续上述计算步骤。
在这里插入图片描述