[概率论与数理统计]笔记:5.4 假设检验概述
5.4 假设检验概述
假设检验问题的提法

基本概述
在实际问题中,总体分布通常是未知的,可能是分布的类型未知,也可能是分布的相关参数未知,比如已知是正态分布,但是不知道参数
于是总体分布未知可以分为类型未知和参数未知两种情况。
对于这些未知,我们可以提出一种推断,比如说”假设总体服从正态分布“,或者说”假设正态分布的
因为参数未知进行的推断叫做参数假设,而对其他未知比如类型未知进行的推断叫做非参数假设。
假设之后,我们需要使用样本来证明我们推断的准确性,这个过程叫做假设检验。
对参数假设进行的检验叫做参数假设检验,对非参数假设进行的检验叫做非参数假设检验。
假设
- 待检验的假设称为原假设或零假设,记作
. - 与之对立的假设称为备择假设或对立假设,记作
.
二者是二选一,接受其中一个假设就意味着拒绝另一个假设。
一个假设检验问题通常简记为
案例
有一新工艺,不知道是否能提高生产效率,那么
这个案例可以简记为:
假设检验问题
- 显著性假设检验问题——只提出唯一假设
对 假设检验问题——提出两个假设
基本思想与原理
小概率原理
小概率事件在一次试验中不太可能发生。
论证逻辑
如果
基本概念
- 显著性水平
:在假设检验问题中,小概率事件发生的概率,是事先指定的一个很小的正数。 - 拒绝域:小概率事件对应的样本的取值区域。

当有样本观察值落在拒绝域内,就说明发生了小概率事件,于是便拒绝零假设。
假设检验与置信区间
假设检验与置信区间都需要构造枢轴量。
在求解置信区间的时候,枢轴量有一个未知的
而假设检验的时候,枢轴量中的
基本思想
- 构造一个含待检验参数和分布已知的枢轴量
,在假设 成立的条件下,确定拒绝域。 - 检验法则:小概率事件是否发生。
对应小概率事件,其中 称为 的拒绝域。 对应大概率事件,其中 对应 的接受域。
假设检验的一般步骤
第1步:提出
第2步:假设
第3步:对于给定的
第4步:由样本数据
- 如果
,则拒绝 ,接受 . - 如果
,则接受 ,拒绝 .
两类错误
在假设检验中,我们通过样本来检验假设的准确性。
而抽样具有随机性,并且有时样本容量过小,或者其他原因,都会导致最终的推断可能出现错误。
统计推断是具有误差的,比如天气预报。
第一类错误
弃真:
犯第一类错误的概率记为:
这里的
第二类错误
纳伪/取伪:
犯第二类错误的概率记为:
目标与现实
我们希望
通常,我们更重视
思路:宁信其有,不信其无,或者说严重点记作宁可杀错不可放过。
案例:
-
某刑事案件中有犯人1个,但是只要是有嫌疑的人都会被调查访问。
在这个案例中,第一类错误就是把犯人放跑了,即弃真;第二类错误是只要有嫌疑的人都会被调查,不管其是否真的是犯人,即纳伪。显然我们更关注的是真的那个犯人,所以我们的首要任务是要把第一类错误的错误率压下去,即只要是有嫌疑的人都要被调查访问。
-
体检:不确定身体有没有问题?那就检查一下。
我们不希望“生病了但是不知道自己生病了”,也就是不希望出现第一类错误。就算是没有的病,体检的时候也要检查一下,所以第二类错误在这个案例中是无关紧要的。

使用教材:
《概率论与数理统计》第四版 中国人民大学 龙永红 主编 高等教育出版社
本文作者:feixianxing
本文链接:https://www.cnblogs.com/feixianxing/p/overview-of-hypothesis-testing.html
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步