四、假设检验
1. 假设检验的基本概念
在总体的分布函数完全未知或只知其形式、 但不知其参数的情况下, 为了推断总体的某些性质, 提出某些关于总体的假设。
假设检验就是根据样本对所提出的假设作出判断: 是接受, 还是拒绝。
基本原理
小概率推断原理:小概率事件(概率接近0的事件, 0 ≤ α ≤ 0.05 ), 在一次试验中,实际上可认为不会发生。
基本思想方法
采用概率性质的反证法:先提出假设H0 ,再根据 一次抽样所得到的样本值进行计算。若导致小概率 事件发生,则否认假设H0 ; 否则,接受假设H0 。
零假设与备选假设
显著性水平
pass
数 α 称为显著性水平。
检验统计量
pass
零假设与备选假设
假设检验问题通常叙述为: 在显著性水平 α 下,检验假设 H0 : θ ∈ Θ0 <--> H1 :θ ∈ Θ 1 。. 或称为 在显著性水平 α 下,针对 H1 检验 H0 。
H0 称为原假设或零假设,H1 称为备选假设。
注: 一般以保护原假设为基础,提出原假设。
检验规则
在对问题作出假设以后,需要利用样本的观测值,,根据一定的规则作出一种决策,是接受原假设还是拒绝原假设?这种规则就称为检验规则。
拒绝域与临界点
当检验统计量取某个区域 C 中的值时, 我们拒绝原假设H0 , 则称区域C为拒绝域, 拒绝域的边界点称为临界点.。拒绝域一般用 W 来表示。
pass
两类错误的概率和检验水平
检验函数
由上述检验规则以及拒绝域,我们可以定义如下检验函数,其实就是一个示性函数 δ(X) :
pass
在拒绝域值为1, 不在拒绝域值为 0。
两类错误及记号
假设检验的依据是: 小概率事件在一次试验中很难发生,但很难发生不等于不发生, 因而假设检验所作出的结论有可能是错误的,这种错误有两类:
(1) 当原假设 H0 为真,观察值却落入拒绝域, 而 作出了拒绝 H0 的判断, 称做第一类错误,又叫弃真错误,这类错误是 “以真为假”。犯第一类错误的概率是:
pass
(2) 当原假设 H0 不真,而观察值却落入接受域,而作出了接受 H0 的判断, 称做第二类错误, 又叫取伪错误。 这类错误是 “以假为真”。 犯第二类错误的概率记为:
pass
当样本容量 n 一定时, 若减少犯第一类错误的概率, 则犯第二类错误的概率往往增大。若要使犯两类错误的概率都减小, 除非增加样本容量。
显著性检验
只对犯第一类错误的概率加以控制, 而不考虑犯第二类错误的概率的检验, 称为显著性检验。
双侧备选假设与双侧假设检验
假设采用 H0 :μ = μ0 和 H1 :μ ≠ μ0 ,备选假设 H1 表示 μ 可能大于 μ0 也可能小于 μ0 ,称为双边备选假设,形如 H0 :μ = μ0 和 H1 :μ ≠ μ0 的假设检验称为双边假设检验。
右边检验与左边检验
形如 H0 :μ ≤ μ0 和 H1 :μ > μ0 的假设检验称为右边检验。
形如 H0 :μ ≥ μ0 和 H1 :μ < μ0 的假设检验称为左边检验。
右边检验与左边检验统称为单侧检验。
一致优于
若 δ1 (X) 和 δ2 (X) 是检验问题 H0 : θ ∈ Θ0 <--> H1 :θ ∈ Θ 1 的显著性水平为 α 的两个检验,若
E( δ1 (X) ) ≥ E( δ2 (X) ),θ ∈ Θ 1
对于一切 θ ∈ Θ 1 成立, 则称检验 δ1 (X) 一致优于检验 δ2 (X) 。
此定义表明在限制第一类错误的基础上,第二类错误越小越优,此定义可以推广至多个检验比较。
势函数与无偏检验
对于检验 δ (X),可以定义一个函数 β(θ) = Eθ ( δ (X) ) = P( X ∈ W ) 称 β(θ) 为这个检验的势函数,又称 为功率函数。
注:
- 当 θ ∈ Θ0 时,β(θ) 为犯第一类错误的概率,此时 β(θ) 越小越好。
- 当 θ ∈ Θ1 时,1 - β(θ) 为犯第二类错误的概率,此时 β(θ) 越大越好。
无偏检验
对于检验 δ (X),如果弃真错误概率 β(θ0) (θ0 ∈ Θ0) 与正确决策概率 β(θ1) (θ1 ∈ Θ1) 之间满足 β(θ1) ≥ β(θ0) 称为水平为 α 的检验为无偏检验。
上述条件的假设是势函数 β 为连续函数。
此时,β(θ) 在 Θ0 上越小越好,在 Θ1 上越大越好。
一致最优势检验
pass
尾概率
pass
小结
假设检验的一般步骤:
1. 根据实际问题的要求 提出原假设 H0 和备选假设 H1 ;
2.选择适当的检验统计量,在 H0 成立的条件下,确定它的概率分布;
3.给定显著性水平 α,确定拒绝域 W;
4. 根据样本观察值计算统计量的值;
5. 根据统计量值是否落入拒绝域 W 中,作出拒绝或者接受 H0 的判断。
突然有一天假期结束,时来运转,人生才是真正开始了。