样本量的确定与OC函数
在之前的假设检验文章中我们说过,在样本量固定的情况下,第一类错误的减少必然会导致第二类错误的增加。按照之前的例子,原假设依旧是一家馒头店每天卖出100个馒头,现在如果减少第一类错误(也就是减少显著性水平
α
α
α),也就是如果抽样结果是90-110之间都可以认为这家店店每天卖出100个馒头。相比于认为抽样结果是95-105之间才接受这个原假设,显然有更大的概率认为原假设是正确的(接受
H
0
H_0
H0的概率增加),这会导致对应的两种情况原假设为真和原假设为假的概率都增加,对应第二类错误的概率(
β
β
β)增加。
而在实际应用中,我们通常希望可以同时控制第一类错误和第二类错误的概率,从而使正确率更高,这时候就要求抽样是要选取充足的样本量。如何选取样本量使第二类错误的概率控制在预先的范围里呢?为此我们引入OC函数(施行特征函数):
定义:如果C为参数
θ
\theta
θ的某检验问题的一个检验法,那么我们设
β
(
θ
)
=
P
θ
(
接受
H
0
)
\beta(\theta)=P_\theta(\mathrm{接受} ~ H_0)
β(θ)=Pθ(接受 H0)为检验法C的施行特征函数或者OC函数,图形称为OC曲线。
也就是
β
(
θ
)
\beta(\theta)
β(θ)是在参数为
θ
\theta
θ的情况下接受原假设
H
0
H_0
H0的概率。
如果这个检验法的显著性水平为 α \alpha α,那么当真值 θ ∈ H 0 \theta \in H_0 θ∈H0时, β ( θ ) \beta(\theta) β(θ)为做出正确判断( 在原假设 H 0 H_0 H0为真时接受原假设 H 0 H_0 H0)的概率,如果 θ ∈ H 1 \theta \in H_1 θ∈H1 ,那么这个时候 β ( θ ) \beta(\theta) β(θ)就是犯了第Ⅱ类错误的概率。对应的 1 − β ( θ ) 1-\beta(\theta) 1−β(θ)就是作出正确判断的概率,我们称现在这个时候的函数 1 − β ( θ ) 1-\beta(\theta) 1−β(θ) 为C的功效函数。对于某一个具体的点 θ ∗ ∈ H 1 \theta^*\in H_1 θ∗∈H1,这个函数表示它在这个点的功效。也就是作出正确判断的概率
正态总体均值检验法的OC函数
Z检验法
首先来看右边检验。它的假设是 H 0 : μ ≤ μ 0 , H 1 : μ > μ 0 H_0:\mu \le \mu_0,H_1:\mu > \mu_0 H0:μ≤μ0,H1:μ>μ0。
我们首先推导它的OC函数。我们注意到,在右边检验中,它的拒绝域满足条件为
X
ˉ
−
μ
0
σ
/
n
≥
z
α
\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}\ge z_\alpha
σ/nXˉ−μ0≥zα 。那么对应的OC函数为:
β
(
μ
)
=
P
μ
(
接受
H
0
)
=
P
μ
{
X
ˉ
−
μ
0
σ
/
n
<
z
α
}
=
P
μ
{
X
ˉ
−
μ
σ
/
n
<
z
α
−
μ
−
μ
0
σ
/
n
}
=
Φ
(
z
α
−
λ
)
\beta(\mu)=P_\mu(接受H_0)=P_\mu\left\{\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}<z_\alpha\right\}=P_\mu\left\{\frac{\bar X-\mu}{\sigma/\sqrt{n}}<z_\alpha-\frac{\mu-\mu_0}{\sigma/\sqrt{n}}\right\}=\Phi(z_\alpha-\lambda)
β(μ)=Pμ(接受H0)=Pμ{σ/nXˉ−μ0<zα}=Pμ{σ/nXˉ−μ<zα−σ/nμ−μ0}=Φ(zα−λ)
其中
λ
=
μ
−
μ
0
σ
/
n
\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}
λ=σ/nμ−μ0,
Φ
\Phi
Φ是正态分布累积函数,有:
Φ
(
z
α
)
=
1
−
α
\Phi(z_\alpha)=1-\alpha
Φ(zα)=1−α.OC函数对应的函数图像如下:
这个函数有如下的性质
1.为
λ
=
μ
−
μ
0
σ
/
n
\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}
λ=σ/nμ−μ0的单调递减连续函数
2.
lim
μ
→
μ
0
+
β
(
μ
)
=
1
−
α
,
lim
μ
→
∞
β
(
μ
)
=
0
\lim_{\mu \to \mu_0^+}\beta(\mu)=1-\alpha,\lim_{\mu \to \infty}\beta(\mu)=0
limμ→μ0+β(μ)=1−α,limμ→∞β(μ)=0 ,这是由概率函数的右连续性决定的
很显然我们希望 μ > μ 0 \mu > \mu_0 μ>μ0时函数的值都可以降到 β \beta β以下,但是因为 μ 0 \mu_0 μ0这个边界点的存在我们做不到让所有的处于拒绝域的值犯第Ⅱ类错误的概率都很低,因为必然会存在在 μ 0 \mu_0 μ0附近的 μ ( μ > μ 0 ) \mu(\mu > \mu_0) μ(μ>μ0)使 β ( μ ) \beta(\mu) β(μ)几乎等于 1 − α 1-\alpha 1−α.而为了控制第一类错误发生的概率, α \alpha α都设置的很小,所以无论样本量 n n n 多大,对于所有的 μ > μ 0 \mu > \mu_0 μ>μ0,即真值为 H 1 H_1 H1所规定的任意一点,控制犯第二类错误的概率都很小是不可能的。但是可以让 μ > μ 0 \mu > \mu_0 μ>μ0时 β ( μ ) \beta(\mu) β(μ)的值,也就是犯第二类错误的概率可以急剧下降,这样当 μ ≥ μ 0 + δ \mu \ge \mu_0+\delta μ≥μ0+δ时犯第二类错误的概率 β \beta β都可以很小。其中 δ \delta δ是人为给定的,很明显 δ \delta δ越小说明检验法的准确程度越高。
所以最终得到的计算公式为:
β
(
μ
0
+
δ
)
=
Φ
(
z
α
−
n
δ
/
σ
)
≤
β
\beta(\mu_0+\delta)=\Phi(z_\alpha-\sqrt{n}\delta/\sigma)\le \beta
β(μ0+δ)=Φ(zα−nδ/σ)≤β
化简可得
z
α
−
n
δ
/
σ
≤
−
z
β
z_\alpha-\sqrt{n}\delta/\sigma \le -z_\beta
zα−nδ/σ≤−zβ
对于左边检验,按照同样的逻辑和步骤,你会发现结果是一样的
从而计算得出Z检验单侧检验的最小样本量计算公式:
n
≥
(
z
α
+
z
β
)
σ
δ
\sqrt{n} \ge \frac{(z_\alpha+z_\beta)\sigma}{\delta}
n≥δ(zα+zβ)σ
这个时候我们就能使得
μ
∈
H
1
且
μ
≥
μ
0
+
δ
\mu \in H_1\mathrm{~ 且~}\mu \ge \mu_0+\delta
μ∈H1 且 μ≥μ0+δ的时候,它犯第Ⅱ类错误的概率不超过
β
\beta
β 。
下面来看双边假设检验。
双边检验问题
H
0
:
μ
=
μ
0
,
H
1
:
μ
≠
μ
0
H_0:\mu=\mu_0,H_1:\mu \neq \mu_0
H0:μ=μ0,H1:μ=μ0的OC函数为:
β
(
μ
)
=
P
μ
(
接受
H
0
)
=
P
μ
{
−
z
α
/
2
<
X
ˉ
−
μ
0
σ
/
n
<
z
α
/
2
}
=
Φ
(
z
α
/
2
−
λ
)
+
Φ
(
z
α
/
2
+
λ
)
−
1
\beta(\mu)=P_\mu(接受H_0)=P_\mu\left\{-z_{\alpha/2}<\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}<z_{\alpha/2}\right\}=\Phi(z_{\alpha/2}-\lambda)+\Phi(z_{\alpha/2}+\lambda)-1
β(μ)=Pμ(接受H0)=Pμ{−zα/2<σ/nXˉ−μ0<zα/2}=Φ(zα/2−λ)+Φ(zα/2+λ)−1
其中
λ
=
μ
−
μ
0
σ
/
n
\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}
λ=σ/nμ−μ0,
Φ
\Phi
Φ是正态分布累积函数。OC函数对应的函数图像如下:
在这种情况下,我们需要解超越方程 β = Φ ( z α / 2 − n δ / σ ) + Φ ( z α / 2 + n δ / σ ) − 1 \beta=\Phi(z_{\alpha/2}-\sqrt{n}\delta/\sigma)+\Phi(z_{\alpha/2}+\sqrt{n}\delta/\sigma)-1 β=Φ(zα/2−nδ/σ)+Φ(zα/2+nδ/σ)−1确定n,但是一般来说 n n n总是很大的,因此我们可以认为 Φ ( z α / 2 + n δ / σ ) ≈ 1 \Phi(z_{\alpha/2}+\sqrt{n}\delta/\sigma) \approx 1 Φ(zα/2+nδ/σ)≈1 ,也就是说我们只需要满足不等式 Φ ( z α / 2 − n δ / σ ) ≤ β \Phi(z_{\alpha/2}-\sqrt{n}\delta/\sigma) \le \beta Φ(zα/2−nδ/σ)≤β ,解得 n ≥ ( z α / 2 + z β ) σ δ \sqrt{n} \ge(z_{\alpha/2}+z_\beta)\frac\sigma\delta n≥(zα/2+zβ)δσ,这就是Z检验在双侧检验的情况下最小样本量的公式。
t检验法
对于t检验的右侧检验的OC函数为
β
(
μ
)
=
P
μ
{
X
ˉ
−
μ
0
S
/
n
<
t
α
(
n
−
1
)
}
\beta(\mu)=P_\mu\left\{\frac{\bar X-\mu_0}{S/\sqrt{n}}<t_\alpha(n-1)\right\}
β(μ)=Pμ{S/nXˉ−μ0<tα(n−1)}
其中有:
X
ˉ
−
μ
0
S
/
n
=
(
X
ˉ
−
μ
σ
/
n
+
λ
)
/
(
S
σ
)
,
λ
=
μ
−
μ
0
σ
/
n
\frac{\bar X-\mu_0}{S/\sqrt{n}}=(\frac{\bar X-\mu}{\sigma/\sqrt{n}}+\lambda)/(\frac{S}{\sigma}),\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}
S/nXˉ−μ0=(σ/nXˉ−μ+λ)/(σS),λ=σ/nμ−μ0
解出这个具体的值超出了我们所学的内容。但是如果给定了
α
,
β
,
δ
\alpha,\beta,\delta
α,β,δ,我们查表是可以得到需要的样本量
n
n
n的,这样使得
μ
∈
H
1
\mu \in H_1
μ∈H1且
μ
−
μ
0
σ
≥
δ
\frac{\mu-\mu_0}{\sigma} \ge \delta
σμ−μ0≥δ犯第Ⅱ类错误的概率不超过
β
\beta
β。
要注意这里的不等式不再是 μ − μ 0 ≥ δ \mu-\mu_0 \ge \delta μ−μ0≥δ而是 μ − μ 0 σ ≥ δ \frac{\mu-\mu_0}{\sigma} \ge \delta σμ−μ0≥δ
双边检测时,对应的不等式为 ∣ μ − μ 0 ∣ σ ≥ δ \frac{|\mu-\mu_0|}{\sigma} \ge \delta σ∣μ−μ0∣≥δ
但是在实际的应用中
σ
\sigma
σ一般是不知道的,这是就没有办法通过
δ
=
∣
μ
−
μ
0
∣
σ
\delta=\frac{|\mu-\mu_0|}{\sigma}
δ=σ∣μ−μ0∣来计算
δ
\delta
δ并查表得到样本量了。可以按照如下步骤来近似算一下:首先适当的取一个值
n
1
n_1
n1 ,抽取容量为
n
1
n_1
n1的样本,并根据这一样本计算出
s
2
s^2
s2的值,以
s
2
s^2
s2作为
σ
2
\sigma^2
σ2的估计值计算得到
δ
\delta
δ的近似值,代入查表得到
n
2
n_2
n2。如果
n
1
≥
n
2
n_1 \ge n_2
n1≥n2,则取
n
1
n_1
n1作为样本容量。如果
n
2
n_2
n2更大,那么就抽取
n
2
−
n
1
n_2-n_1
n2−n1个样本补充进原样本,按照一样的步骤计算
s
2
,
δ
s^2,\delta
s2,δ ,然后查表得到
n
3
n_3
n3 ,若
n
2
≥
n
3
n_2 \ge n_3
n2≥n3,则取
n
2
n_2
n2作为样本容量,否则继续上述计算步骤。
本文来自博客园,作者:Smilecoc,转载请注明原文链接:https://www.cnblogs.com/smilecoc/p/18724305
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· 单线程的Redis速度为什么快?
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码