【概率论与数理统计】小结9-3 - 区间估计
注:区间估计是除点估计之外的另一类参数估计。相对于点估计只给出一个具体的数值,区间估计能够给出一个估计的范围。
0. 点估计 vs 区间估计
根据具体样本观察值,点估计提供了一个明确的数值。但是这种判断的把握有多大,点估计本身并没有给出。区间估计就是为了弥补点估计的这种不足而提出来的。
相同点:
- 都可以给出未知参数的估计;
- 估计的准确度都依赖取样的质量.
不同点:
- 点估计需要的信息少(矩估计仅需要样本信息),得到的估计值也比较粗略;
- 区间估计需要的信息更多(除了样本,还需要知道总体或样本的某些数字特征的分布形式),得到的结果是包含置信水平的一个区间.
区间估计:
设$X$是总体,$X_1, ..., X_n$是一个样本. 区间估计的目的是找到两个统计量:
$\hat{\theta_1} = \hat{\theta_1}(X_1, ..., X_n),$
$\hat{\theta_2} = \hat{\theta_2}(X_1, ..., X_n),$
使随机区间$(\hat{\theta_1}, \hat{\theta_2})$以一定可靠程度盖住$\theta$.
1. 置信水平和置信区间
1.1 定义
设总体$X$的分布函数$F(x;\theta)$, $\theta$未知. 对给定值$\alpha(0< \alpha <1)$,有两个统计量
$\hat{\theta_L} = \hat{\theta_L}(X_1, ..., X_n),\ \hat{\theta_U} = \hat{\theta_U}(X_1, ..., X_n), $
使得:$P\{\hat{\theta_L}(X_1, ..., X_n) < \theta < \hat{\theta_U}(X_1, ..., X_n)\} \geq 1 - \alpha$
则$(\hat{\theta_L}, \hat{\theta_U})$称为$\theta$的置信水平为$1 - \alpha$的双侧置信区间;
$\hat{\theta_L}$和$\hat{\theta_U}$分别称为双侧置信下限和双侧置信上限.
1.2 说明
参数$\theta$虽然未知,但是确定的值。$\hat{\theta_L}, \hat{\theta_U}$是统计量,随机的,依赖于样本;
置信区间$(\hat{\theta_L}, \hat{\theta_U})$也是随机的,依赖于样本。样本不同,算出来的区间也不同。
对于有些样本观察值,区间覆盖$\theta$,但对于另一些样本观察值,区间则不能覆盖$\theta$。
例题1
设总体$X \sim N(\mu, 4)$, $\mu$未知,$X_1, ..., X_4$是一个样本。则$\bar{X} \sim N(\mu, 1)$(样本均值的分布).
$P(\bar{X} - 2 < \mu < \bar{X} + 2) = P(|\bar{X} - \mu| < 2) = 2\Phi(2) - 1 = 0.9544$
=> $(\bar{X} - 2, \bar{X} + 2)$是$\mu$的置信水平为0.95的置信区间。
若$\mu = 0.5$(总体均值的真实值,待估计值),当$\bar{x}$分别为3, 2,1时,对应区间为:$(1, 5), (0, 4), (-1, 3)$
对于一个具体的估计结果而言,或者包含真值(后两个区间),或者不包含真值(第一个区间),无概率可言。这就像是某产品的合格率是99%,但是对每一个具体的消费者而言,买到的产品要么是合格品要么是次品,没有概率可言;但是从消费者群体来看,99%表示如果有10000个人购买了这件商品,会有100个人买到次品。
1.3 单侧置信区间
如果$P\{\hat{\theta_L}(X_1, ..., X_n) < \theta\} \geq 1 - \alpha$,则$\hat{\theta_L}$称为参数$\theta$的置信水平$1 - \alpha$的单侧置信下限;
如果$P\{\theta < \hat{\theta_U}(X_1, ..., X_n)\} \geq 1 - \alpha$,则$\hat{\theta_U}$称为参数$\theta$的置信水平$1 - \alpha$的单侧置信上限;
单侧置信限和双侧置信区间的关系:
设$\hat{\theta_L}$是$\theta$的置信水平为$1 - \alpha_1$的单侧置信下限,$\hat{\theta_U}$是$\theta$的置信水平为$1 - \alpha_2$的单侧置信上限,则$(\hat{\theta_L}, \hat{\theta_U})$是$\theta$的置信度为$1 - \alpha_1 - \alpha_2$的双侧置信区间。表示成公式如下(通常下面的$\alpha_1$和$\alpha_2$都是非常小的值):
$P\{\hat{\theta_L} >= \theta\} \leq \alpha_1$, $P\{\theta \geq \hat{\theta_U}\} \leq \alpha_2$, =>
$P\{\hat{\theta_L} < \theta < \hat{\theta_U}\} = 1 - P\{\hat{\theta_L} \geq \theta\} - P\{\hat{\theta_U} \leq \theta\} \geq 1 - \alpha_1 - \alpha_2$.
相当于:$\theta$小于$\hat{\theta_L}$的概率非常小,$\theta$大于$\hat{\theta_U}$的概率也非常小,那么$\theta$在这两者之间的概率就比较大。
1.4 精确度
置信区间$(\hat{\theta_L}, \hat{\theta_U})$的平均长度$E(\hat{\theta_U} - \hat{\theta_L})$为区间的精确度,精确度的一半为误差限。(因为每次抽样获得的数据点不同 => 每次得到的样本均值和方差不同 => 在置信水平一定的情况下,置信区间的长度不同)
在给定的样本容量下,置信水平和精确度是相互制约的。置信水平越高,精确度越低;相反精确度越高,置信水平越低。置信水平确定了置信区间的大小,如果置信水平非常高(例如接近1),那么置信区间就会非常宽。这个时候,无论怎么抽样,得到的区间估计几乎总会包含待估计的真值。但是由于范围太大了,这个估计的区间也就失去了意义(精确度太低)。例如,需要估计一个中等规模的电影院里每天来看电影的人数,如果我们估计的区间是$[1, 100000]$,这个估计的置信水平非常高(真实观影人数肯定是在这个区间),但是这样的估计几乎没什么价值。
1.5 对置信区间的理解
一般地,$P\{\hat{\theta_L}(X_1, ..., X_n) < \theta < \hat{\theta_U}(X_1, ..., X_n)\} = 1 - \alpha$,则置信区间$(\hat{\theta_L}, \hat{\theta_U})$的含义为:
反复抽样多次(例如$m$次,每次都随机抽出$n$个数据点),这些抽到的样本(共$m$个样本,$m*n$个数据点),每一个都能确定一个区间$(\hat{\theta_L}^{(i)}, \hat{\theta_U}^{(i)})$(第$i$次抽样进行区间估计后确定的区间),每个这样的区间可能包含真值$\theta$,也可能不包含真值$\theta$。按照伯努利大数定律,当抽样次数足够大时,在这些区间中,包含真值$\theta$的比例约为$1 - \alpha$.
对于每次抽样进行区间估计时,置信区间就是一个概率分布函数中某两个点之间的区域,例如例1中的$(\bar{X} - 2, \bar{X} + 2)$;置信水平就是这两个点各自对x轴的垂线,以及x轴和密度函数所围成的区域的面积(例如上例中的0.95)。置信区间越窄,精确度就越高(不确定性更小,结果更加精确),但此时置信区间可以围成的面积就越小,所以置信水平就越小(即在多次抽样中,区间估计的结果很难包含真值$\theta$,但是一旦包含,结果的范围就可以限制在一个非常小的范围)。假如反复抽样10000次,且设定$\alpha = 0.1$,即置信水平为90%(置信水平限制了每次区间估计时的取值范围),那么这10000个区间估计的结果中包含真值$\theta$的约为9000个。
2. 枢轴量
在小结"小结9-1 - 参数估计概述"中,对枢轴量的定义,以及枢轴量与统计量之间的差别作了简单介绍。下面进一步介绍枢轴量法需要解决的问题以及枢轴量的构造和常见的枢轴量。
2.1 枢轴量法需要解决的问题
枢轴量法作为区间估计的主要方法,要求解的问题如下:
设总体$X$的分布含有未知参数$\theta$,$X_1, ..., X_n$是一次抽样得到的样本。
如何给出$\theta$的置信水平为$1 - \alpha$的双侧置信区间(或单侧置信上限、单侧置信下限)?
求解步骤:
(1) 找一个随机变量$G$,该随机变量需要满足以下两个条件:
- 分布已知;
- 是总体未知参数$\theta$和样本$X_1, ..., X_n$的函数
(2) 找$a \lt b$,使$P(a \lt G \lt b) \geq 1 - \alpha$
(3) 从$a \lt G \lt b$解出$\hat{\theta}_L \lt \theta \lt \hat{\theta}_U$
$(\hat{\theta}_L, \hat{\theta}_U)$就是置信度为$1 - \alpha$的双侧置信区间。
边界$a, b$的选择
对于枢轴量$G$,满足$P(a < G <b) \geq 1 - \alpha$的$a, b$可能有很多,这时可以参考下面的原则来进行选择:
(1) 根据Neyman原则:求$a$和$b$使得区间长度最短;
(2) 如果最优解不存在或比较复杂,对连续总体,常取$a$和$b$满足
$P(G(X_1, ..., X_n; \theta) \leq a) = P(G(X_1, ..., X_n; \theta) \geq b) = \alpha/2$
例题2
在点估计中有一个例子:为了估计4000名学生《微积分》课程的平均成绩,随机抽出了100名学生并用这100名同学的《微积分》课程的平均成绩来估计4000名学生的平均成绩,这就相当于完成了一次矩估计。
下面从区间估计的角度来解决这个问题:
从4000名学生中随机选出100名,计算得到他们《微积分》课程的平均成绩为72.3分,标准差为15.8分。假设全部学生的成绩$X \sim N(\mu, \sigma^2)$, $\mu, \sigma$均未知,求$\mu$的置信水平为95%的双侧置信区间。
解:
对于正态总体$X \sim N(\mu, \sigma^2)$, $X_1, ..., X_n$是$X$的样本,那么$\mu$的极大似然估计是$\bar{X}$,
$\bar{X} \sim N(\mu, \frac{\sigma^2}{n}), => \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1)$
由于$\sigma$未知,不能取$\frac{\bar{X} - \mu}{\sigma/\sqrt{n}}$作为枢轴量!
用样本方差代替总体方差可以得到,$\frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n - 1)$,$\frac{\bar{X} - \mu}{S/\sqrt{n}}$符合枢轴量的定义,可以作为本次估计的枢轴量。此时问题转化成
求$a, b$,使得$P(a < \frac{\bar{X} - \mu}{S/\sqrt{n}} < b) = 0.95%$,且置信区间最短.
即:$\bar{X} - b \frac{S}{\sqrt{n}} < \mu < \bar{X} - a \frac{S}{\sqrt{n}}$
且$E(\bar{X} - a \frac{S}{\sqrt{n}}) - E(\bar{X} - b \sqrt{S}{\sqrt{n}}) = (b - a) \frac{E(S)}{\sqrt{n}} = min$
等价于在$P(a < \frac{\bar{X} - \mu}{S/\sqrt{n}} < b) = 0.95%$成立的$a, b$中$b-a = min$
由于t分布是对称的,所以$b = -a = t_{0.0025}(99) \approx z_{0.0025} = 1.96$
由$\bar{x} = 72.3, s = 15.8$计算得,$\mu$的置信水平为95%的双侧置信区间为$(69.2, 75.4)$.
这一置信区间有95%的把握包含真值。
2.2 枢轴量的构造
枢轴量$G(X_1, ..., X_n; \theta)$的构造,通常从$\theta$的点估计$\hat{\theta}$(如极大似然估计,矩估计等)出发,根据$\theta$的分布(或包含$\theta$的函数的分布)进行改造而得。
2.3 常见枢轴量
从区间估计的求解流程和上面的例子可以看出来,如果要使用枢轴量法来作区间估计,找到合适的枢轴量是关键。在上面的例子中,由于总体的分布已知,因此对总体的均值$\mu$进行估计的时候,先用样本均值$\bar{X}$来进行点估计,然后再使用样本均值构造服从t分布的枢轴量来确定区间的边界$a, b$.
- 下面所有的枢轴量都是跟总体均值和方差有关的,因此我们能估计的也仅限于这两个参数;
- 总体方差已知和未知是两种不同的情况,构造出来的枢轴量属于不同的分布;
- 具有两个正态总体时,可以估计两个不同总体均值的差或方差的比值.
2.3.1 单个正态总体$N(\mu, \sigma^2)$情形
(1) $\mu$的枢轴量:
- $\sigma^2$已知时,$\frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \sim N(0, 1)$
- $\sigma^2$未知时,$\frac{\bar{X} - \mu}{S / \sqrt{n}} \sim t(n - 1)$
(2) $\sigma^2$的枢轴量:
$\mu$未知,$\frac{(n-1) S^2}{\sigma^2} \sim \chi^2(n-1)$
2.3.2 二个正态总体$N(\mu_1, \sigma_1^2), N(\mu_2, \sigma_2^2)$的情形
(1) $\mu_1 - \mu_2$的枢轴量:
- $\sigma_1^2, \sigma_2^2$已知时,
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1)$$
- $\sigma_1^2 = \sigma_2^2$未知时,
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{1/n_1 + 1/n_2}} \sim t(n_1 + n_2 - 2)$$
其中$S_w^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}, S_w = \sqrt{S_w^2}$
(2) $\frac{\sigma_1^2}{\sigma_2^2}$的枢轴量
$\mu_1, \mu_2$未知
$$\frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} \sim F(n_1 - 1, n_2 - 1)$$
2.3.3 其他总体均值的区间估计
设总体$X$的均值为$\mu$,方差为$\sigma^2$,非正态分布或不知分布形式. 样本为$X_1, ..., X_n$.
当n充分大(一般$n > 30$)时,有中心极限定理知,$\bar{X} \sim N(\mu, \sigma^2/n)$,因此
$$\frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1)$$
以上分布为近似分布
当$\sigma^2$已知时,$\mu$的置信水平为$1 - \alpha$的近似置信区间为
$$(\bar{X} - z_{\alpha/2} \sigma / \sqrt{n}, \bar{X} + z_{\alpha/2} \sigma / \sqrt{n})$$
当$\sigma^2$未知时,以样本方差$S^2$代入,得近似置信区间为
$$(\bar{X} - z_{\alpha/2} S / \sqrt{n}, \bar{X} + z_{\alpha/2} S / \sqrt{n})$$
3. 区间估计的类型
3.1 单个正态总体
单个正态总体均值的区间估计让我们在一定样本量的情况下,对总体的均值有一个大概的认识,并且这种认识是有一定保证的(置信度)。例如,我们可以通过随机选取几十个婴儿,测量他们的体重,从而得知几乎所有的婴儿(比如95%的婴儿)的体重大概在什么范围。
3.1.1 总体均值$\mu$的置信区间
设总体$X \sim N(\mu, \sigma^2)$, $X_1, X_2, ..., X_n$为样本. $\bar{X}$和$S^2$分别为样本均值和样本方差,置信水平为$1 - \alpha$.
(1) 总体方差$\sigma^2$已知时
$\bar{X}$是$\mu$的极大似然估计,取枢轴量$G = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \sim N(0, 1)$
设常数$a < b$满足:$P\{a < G < b\} \geq 1 - \alpha$
等价于 $P\{\bar{X} - \frac{\sigma}{\sqrt{n}} b < \mu < \bar{X} - \frac{\sigma}{\sqrt{n}} a\} \geq 1 - \alpha$ ($1 - \alpha$就是置信区间与概率密度函数和x轴围成的面积)
由正态分布的对称性可知,$a = -b = - z_{\alpha/2}$时,置信区间的长度$L$达到最短$L = 2 z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$. 固定n,置信水平提高,即$(1 - \alpha)$增大,则$z_{\alpha/2}$增大,所有$L$变大,精确度降低;反之亦然。
所以$\mu$的双侧置信区间为:
$$(\bar{X} - \frac{\sigma}{\sqrt{n}} z_{\alpha/2}, \bar{X} + \frac{\sigma}{\sqrt{n}} z_{\alpha/2})$$
单侧置信下限为:$\bar{X} - \frac{\sigma}{\sqrt{n}} z_{\alpha}$
单侧置信上限为:$\bar{X} + \frac{\sigma}{\sqrt{n}} z_{\alpha}$
(2) 总体方差$\sigma^2$未知时
以样本方差$S^2$估计$\sigma^2$,得枢轴量$G = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)$
由$-t_{\alpha/2}(n-1) < G < t_{\alpha/2}(n-1)$解得,
$\bar{X} - \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1) < \mu < \bar{X} + \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1)$
所以$\mu$的置信区间为:
$$(\bar{X} - \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1), \bar{X} + \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1))$$
单侧置信下限为:$\bar{X} - \frac{S}{\sqrt{n}} t_{\alpha}(n-1)$
单侧置信上限为:$\bar{X} + \frac{S}{\sqrt{n}} t_{\alpha}(n-1)$
3.1.2 总体方差$\sigma^2$的置信区间($\mu$未知)
设总体$X \sim N(\mu, \sigma^2)$, $X_1, X_2, ..., X_n$为样本. $\bar{X}$和$S^2$分别为样本均值和样本方差,置信水平为$1 - \alpha$.
由$\sigma^2$的估计$S^2$,得到枢轴量$\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$
由$\chi^2_{1-\alpha/2}(n-1) < \frac{(n-1)S^2}{\sigma^2} < \chi^2_{\alpha/2}(n-1)$
推出
$$\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)} < \alpha^2 < \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)}$$
因此双侧置信区间为:$(\frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1 - \alpha/2}(n-1)})$
单侧置信下限为:$\frac{(n-1)S^2}{\chi^2_{\alpha}(n-1)}$
单侧置信上限为:$\frac{(n-1)S^2}{\chi^2_{1 - \alpha}(n-1)}$
例题2:
某种产品的寿命(单位:千小时)$X \sim N(\mu, \sigma^2)$,$\mu, \sigma^2$未知. 现随机抽查10件产品进行寿命试验,测得样本均值$\bar{x} = 5.78$,样本方差$s = 0.92$. 求$\mu$的置信水平为95%的单侧置信下限.
解:由于总体方差未知,以样本方差$S^2$估计$\sigma^2$,得枢轴量$G = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)$
利用下面的方法计算t分布中$\alpha = 0.05$时,x的值,即$t_{\alpha}(n-1) = t_{0.05}(9)$的值
from scipy import stats stats.t.isf(0.05, 9)
结果为:
1.8331129326536337
所以$\mu$的置信水平为95%的单侧置信下限为:
$\bar{x} - \frac{s}{\sqrt{10}} t_{0.05}(9) = 5.78 - \frac{0.92}{\sqrt{10}} \times 1.833 = 5.25$
更多关于上$\alpha$分位数的内容,可以参考"小结8 - 三大抽样分布"中的第0小节(分位点/分位数)和第1.4小节(分位数的计算)
3.2 成对数据
这里的区间估计是指成对数据差的均值置信区间的估计
引例:为考察某种降压药的降压效果,测试了n个高血压病人在服药前后的血压(收缩压)为
$$(X_1, Y_1), ..., (X_n, Y_n).$$
由于个人体质的差异,$X_1, ..., X_n$不能看成来自同一个正态总体的样本,即$X_1, ..., X_n$是相互独立但不同分布的样本,$Y_1, ..., Y_n$也是. 另外对同一个个体,$X_i$和$Y_i$也是不独立的.
作差值$D_i = X_i - Y_i, i = 1, ..., n$,则取消了个体差异,仅与降压药的作用有关,因此可以将$D_1, ..., D_n$看成来自同一个正态总体$N(\mu_D, \sigma^2_D)$的样本,且相互独立.
由此可得,$\mu_D$的置信水平为$1-\alpha$的置信区间为:
$$(\bar{D} - t_{\alpha/2}(n-1)\frac{S_D}{\sqrt{n}}, \bar{D} + t_{\alpha/2}(n-1)\frac{S_D}{\sqrt{n}})$$
其中$\bar{D} = \bar{X} - \bar{Y}, S_D = \sqrt{\frac{1}{n-1} \sum_{ i = 1 }^{ n } (D_i - \bar{D})^2}$
3.3 两个正态总体
设样本$(X_1, ..., X_{n_1})$和$(Y_1, ..., Y_{n_2})$分别来自总体$N(\mu_1, \sigma^2)$和$N(\mu, \sigma^2)$,并且它们相互独立. 样本均值分别为$\bar{X}, \bar{Y}$;样本方差分别为$S_1^2, S_2^2$. 置信水平为$1-\alpha$.
3.3.1 两个均值差$(\mu_1 - \mu_2)$的置信区间
(1) $\sigma_1^2, \sigma_2^2$已知时
由$\mu_1 - \mu_2$的估计$\bar{X} - \bar{Y}$的分布,得枢轴量:
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1)$$
得置信区间:$((\bar{X} - \bar{Y}) - z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}, (\bar{X} - \bar{Y}) + z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}})$
(2) $\sigma_1^2 = \sigma_2^2$未知
以$S_w^2 = \frac{(n_1 - 1) S_1^2 + (n_2 - 1) S_2^2}{n_1 + n_2 - 2}$代替$\sigma^2$得枢轴量:
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)$$
置信区间为:$((\bar{X} - \bar{Y}) - t_{\alpha/2}(n_1 + n_2 - 2) S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}, (\bar{X} - \bar{Y}) + t_{\alpha/2}(n_1 + n_2 - 2) S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}})$
(3) $\sigma_1^2 \neq \sigma_2^2$且未知
以$S_1^2$估计$\sigma_1^2$,以$S_2^2$估计$\sigma_2^2$
- 当样本量$n_1$和$n_2$都充分大时(一般要>30),
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}} \sim N(0, 1)$$
以上为近似分布,得近似置信区间为:$((\bar{X} - \bar{Y}) - z_{\alpha/2} \sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}, (\bar{X} - \bar{Y}) + z_{\alpha/2} \sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}})$
- 当样本量较小时,
$$\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}} \sim t(k),$$
以上为近似分布,其中$k \approx min(n_1 - 1, n_2 - 1)$,得近似置信区间为:
$((\bar{X} - \bar{Y}) - t_{\alpha/2}(k) \sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}, (\bar{X} - \bar{Y}) + t_{\alpha/2}(k) \sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}})$
3.3.2 方差之比$\frac{\sigma_1^2}{\sigma_2^2}$的置信区间($\mu_1, \mu_2$未知)
由$\frac{\sigma_1^2}{\sigma_2^2}$的估计$\frac{S_1^2}{S_2^2}$得到枢轴量
$$\frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} \sim F(n_1 - 1, n_2 - 1)$$
由$F_{1 - \frac{\alpha}{2}}(n_1 - 1, n_2 - 1) < \frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} < F_{\frac{\alpha}{2}}(n_1 - 1, n_2 - 1)$
得$\frac{S_1^2}{S_2^2} \frac{1}{F_{\frac{\alpha}{2}}(n_1 - 1, n_2 - 1)} < \frac{\sigma_1^2}{\sigma_2^2} < \frac{S_1^2}{S_2^2} \frac{1}{F_{1 - \frac{\alpha}{2}}(n_1 - 1, n_2 - 1) }$
置信区间为:
$$(\frac{S_1^2}{S_2^2} \frac{1}{F_{\frac{\alpha}{2}}(n_1 - 1, n_2 - 1)}, \frac{S_1^2}{S_2^2} \frac{1}{F_{1 - \frac{\alpha}{2}}(n_1 - 1, n_2 - 1) })$$
欢迎阅读“概率论与数理统计及Python实现”系列文章
Reference
中国大学MOOC:浙江大学,概率论与数理统计