样本量的确定与OC函数

在之前的假设检验文章中我们说过,在样本量固定的情况下,第一类错误的减少必然会导致第二类错误的增加。按照之前的例子,原假设依旧是一家馒头店每天卖出100个馒头,现在如果减少第一类错误(也就是减少显著性水平 α α α),也就是如果抽样结果是90-110之间都可以认为这家店店每天卖出100个馒头。相比于认为抽样结果是95-105之间才接受这个原假设,显然有更大的概率认为原假设是正确的(接受 H 0 H_0 H0的概率增加),这会导致对应的两种情况原假设为真和原假设为假的概率都增加,对应第二类错误的概率( β β β)增加。
在这里插入图片描述

而在实际应用中,我们通常希望可以同时控制第一类错误和第二类错误的概率,从而使正确率更高,这时候就要求抽样是要选取充足的样本量。如何选取样本量使第二类错误的概率控制在预先的范围里呢?为此我们引入OC函数(施行特征函数):

定义:如果C为参数 θ \theta θ的某检验问题的一个检验法,那么我们设 β ( θ ) = P θ ( 接受  H 0 ) \beta(\theta)=P_\theta(\mathrm{接受} ~ H_0) β(θ)=Pθ(接受 H0)为检验法C的施行特征函数或者OC函数,图形称为OC曲线。
也就是 β ( θ ) \beta(\theta) β(θ)是在参数为 θ \theta θ的情况下接受原假设 H 0 H_0 H0的概率。

如果这个检验法的显著性水平为 α \alpha α,那么当真值 θ ∈ H 0 \theta \in H_0 θH0时, β ( θ ) \beta(\theta) β(θ)为做出正确判断( 在原假设 H 0 H_0 H0为真时接受原假设 H 0 H_0 H0)的概率,如果 θ ∈ H 1 \theta \in H_1 θH1 ,那么这个时候 β ( θ ) \beta(\theta) β(θ)就是犯了第Ⅱ类错误的概率。对应的 1 − β ( θ ) 1-\beta(\theta) 1β(θ)就是作出正确判断的概率,我们称现在这个时候的函数 1 − β ( θ ) 1-\beta(\theta) 1β(θ) 为C的功效函数。对于某一个具体的点 θ ∗ ∈ H 1 \theta^*\in H_1 θH1,这个函数表示它在这个点的功效。也就是作出正确判断的概率

正态总体均值检验法的OC函数

Z检验法

首先来看右边检验。它的假设是 H 0 : μ ≤ μ 0 , H 1 : μ > μ 0 H_0:\mu \le \mu_0,H_1:\mu > \mu_0 H0:μμ0,H1:μ>μ0

我们首先推导它的OC函数。我们注意到,在右边检验中,它的拒绝域满足条件为 X ˉ − μ 0 σ / n ≥ z α \frac{\bar X-\mu_0}{\sigma/\sqrt{n}}\ge z_\alpha σ/n Xˉμ0zα 。那么对应的OC函数为:
β ( μ ) = P μ ( 接受 H 0 ) = P μ { X ˉ − μ 0 σ / n < z α } = P μ { X ˉ − μ σ / n < z α − μ − μ 0 σ / n } = Φ ( z α − λ ) \beta(\mu)=P_\mu(接受H_0)=P_\mu\left\{\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}<z_\alpha\right\}=P_\mu\left\{\frac{\bar X-\mu}{\sigma/\sqrt{n}}<z_\alpha-\frac{\mu-\mu_0}{\sigma/\sqrt{n}}\right\}=\Phi(z_\alpha-\lambda) β(μ)=Pμ(接受H0)=Pμ{σ/n Xˉμ0<zα}=Pμ{σ/n Xˉμ<zασ/n μμ0}=Φ(zαλ)
其中 λ = μ − μ 0 σ / n \lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}} λ=σ/n μμ0, Φ \Phi Φ是正态分布累积函数,有: Φ ( z α ) = 1 − α \Phi(z_\alpha)=1-\alpha Φ(zα)=1α.OC函数对应的函数图像如下:

在这里插入图片描述
这个函数有如下的性质

1.为 λ = μ − μ 0 σ / n \lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}} λ=σ/n μμ0的单调递减连续函数
2. lim ⁡ μ → μ 0 + β ( μ ) = 1 − α , lim ⁡ μ → ∞ β ( μ ) = 0 \lim_{\mu \to \mu_0^+}\beta(\mu)=1-\alpha,\lim_{\mu \to \infty}\beta(\mu)=0 limμμ0+β(μ)=1α,limμβ(μ)=0 ,这是由概率函数的右连续性决定的

很显然我们希望 μ > μ 0 \mu > \mu_0 μ>μ0时函数的值都可以降到 β \beta β以下,但是因为 μ 0 \mu_0 μ0这个边界点的存在我们做不到让所有的处于拒绝域的值犯第Ⅱ类错误的概率都很低,因为必然会存在在 μ 0 \mu_0 μ0附近的 μ ( μ > μ 0 ) \mu(\mu > \mu_0) μμ>μ0使 β ( μ ) \beta(\mu) β(μ)几乎等于 1 − α 1-\alpha 1α.而为了控制第一类错误发生的概率, α \alpha α都设置的很小,所以无论样本量 n n n 多大,对于所有的 μ > μ 0 \mu > \mu_0 μ>μ0,即真值为 H 1 H_1 H1所规定的任意一点,控制犯第二类错误的概率都很小是不可能的。但是可以让 μ > μ 0 \mu > \mu_0 μ>μ0 β ( μ ) \beta(\mu) β(μ)的值,也就是犯第二类错误的概率可以急剧下降,这样当 μ ≥ μ 0 + δ \mu \ge \mu_0+\delta μμ0+δ时犯第二类错误的概率 β \beta β都可以很小。其中 δ \delta δ是人为给定的,很明显 δ \delta δ越小说明检验法的准确程度越高。

所以最终得到的计算公式为:
β ( μ 0 + δ ) = Φ ( z α − n δ / σ ) ≤ β \beta(\mu_0+\delta)=\Phi(z_\alpha-\sqrt{n}\delta/\sigma)\le \beta β(μ0+δ)=Φ(zαn δ/σ)β
化简可得
z α − n δ / σ ≤ − z β z_\alpha-\sqrt{n}\delta/\sigma \le -z_\beta zαn δ/σzβ

对于左边检验,按照同样的逻辑和步骤,你会发现结果是一样的

从而计算得出Z检验单侧检验的最小样本量计算公式:
n ≥ ( z α + z β ) σ δ \sqrt{n} \ge \frac{(z_\alpha+z_\beta)\sigma}{\delta} n δ(zα+zβ)σ
这个时候我们就能使得 μ ∈ H 1  且  μ ≥ μ 0 + δ \mu \in H_1\mathrm{~ 且~}\mu \ge \mu_0+\delta μH1  μμ0+δ的时候,它犯第Ⅱ类错误的概率不超过 β \beta β

下面来看双边假设检验。
双边检验问题 H 0 : μ = μ 0 , H 1 : μ ≠ μ 0 H_0:\mu=\mu_0,H_1:\mu \neq \mu_0 H0:μ=μ0,H1:μ=μ0的OC函数为:
β ( μ ) = P μ ( 接受 H 0 ) = P μ { − z α / 2 < X ˉ − μ 0 σ / n < z α / 2 } = Φ ( z α / 2 − λ ) + Φ ( z α / 2 + λ ) − 1 \beta(\mu)=P_\mu(接受H_0)=P_\mu\left\{-z_{\alpha/2}<\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}<z_{\alpha/2}\right\}=\Phi(z_{\alpha/2}-\lambda)+\Phi(z_{\alpha/2}+\lambda)-1 β(μ)=Pμ(接受H0)=Pμ{zα/2<σ/n Xˉμ0<zα/2}=Φ(zα/2λ)+Φ(zα/2+λ)1
其中 λ = μ − μ 0 σ / n \lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}} λ=σ/n μμ0, Φ \Phi Φ是正态分布累积函数。OC函数对应的函数图像如下:
在这里插入图片描述

在这种情况下,我们需要解超越方程 β = Φ ( z α / 2 − n δ / σ ) + Φ ( z α / 2 + n δ / σ ) − 1 \beta=\Phi(z_{\alpha/2}-\sqrt{n}\delta/\sigma)+\Phi(z_{\alpha/2}+\sqrt{n}\delta/\sigma)-1 β=Φ(zα/2n δ/σ)+Φ(zα/2+n δ/σ)1确定n,但是一般来说 n n n总是很大的,因此我们可以认为 Φ ( z α / 2 + n δ / σ ) ≈ 1 \Phi(z_{\alpha/2}+\sqrt{n}\delta/\sigma) \approx 1 Φ(zα/2+n δ/σ)1 ,也就是说我们只需要满足不等式 Φ ( z α / 2 − n δ / σ ) ≤ β \Phi(z_{\alpha/2}-\sqrt{n}\delta/\sigma) \le \beta Φ(zα/2n δ/σ)β ,解得 n ≥ ( z α / 2 + z β ) σ δ \sqrt{n} \ge(z_{\alpha/2}+z_\beta)\frac\sigma\delta n (zα/2+zβ)δσ,这就是Z检验在双侧检验的情况下最小样本量的公式。

t检验法

对于t检验的右侧检验的OC函数为
β ( μ ) = P μ { X ˉ − μ 0 S / n < t α ( n − 1 ) } \beta(\mu)=P_\mu\left\{\frac{\bar X-\mu_0}{S/\sqrt{n}}<t_\alpha(n-1)\right\} β(μ)=Pμ{S/n Xˉμ0<tα(n1)}
其中有:
X ˉ − μ 0 S / n = ( X ˉ − μ σ / n + λ ) / ( S σ ) , λ = μ − μ 0 σ / n \frac{\bar X-\mu_0}{S/\sqrt{n}}=(\frac{\bar X-\mu}{\sigma/\sqrt{n}}+\lambda)/(\frac{S}{\sigma}),\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}} S/n Xˉμ0=(σ/n Xˉμ+λ)/(σS),λ=σ/n μμ0
解出这个具体的值超出了我们所学的内容。但是如果给定了 α , β , δ \alpha,\beta,\delta α,β,δ,我们查表是可以得到需要的样本量 n n n的,这样使得 μ ∈ H 1 \mu \in H_1 μH1 μ − μ 0 σ ≥ δ \frac{\mu-\mu_0}{\sigma} \ge \delta σμμ0δ犯第Ⅱ类错误的概率不超过 β \beta β

要注意这里的不等式不再是 μ − μ 0 ≥ δ \mu-\mu_0 \ge \delta μμ0δ而是 μ − μ 0 σ ≥ δ \frac{\mu-\mu_0}{\sigma} \ge \delta σμμ0δ

双边检测时,对应的不等式为 ∣ μ − μ 0 ∣ σ ≥ δ \frac{|\mu-\mu_0|}{\sigma} \ge \delta σμμ0δ

但是在实际的应用中 σ \sigma σ一般是不知道的,这是就没有办法通过 δ = ∣ μ − μ 0 ∣ σ \delta=\frac{|\mu-\mu_0|}{\sigma} δ=σμμ0来计算 δ \delta δ并查表得到样本量了。可以按照如下步骤来近似算一下:首先适当的取一个值 n 1 n_1 n1 ,抽取容量为 n 1 n_1 n1的样本,并根据这一样本计算出 s 2 s^2 s2的值,以 s 2 s^2 s2作为 σ 2 \sigma^2 σ2的估计值计算得到 δ \delta δ的近似值,代入查表得到 n 2 n_2 n2。如果 n 1 ≥ n 2 n_1 \ge n_2 n1n2,则取 n 1 n_1 n1作为样本容量。如果 n 2 n_2 n2更大,那么就抽取 n 2 − n 1 n_2-n_1 n2n1个样本补充进原样本,按照一样的步骤计算 s 2 , δ s^2,\delta s2,δ ,然后查表得到 n 3 n_3 n3 ,若 n 2 ≥ n 3 n_2 \ge n_3 n2n3,则取 n 2 n_2 n2作为样本容量,否则继续上述计算步骤。
在这里插入图片描述

posted @   Smilecoc  阅读(8)  评论(0编辑  收藏  举报  
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· 单线程的Redis速度为什么快?
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
点击右上角即可分享
微信分享提示