园龄：2年8个月粉丝：28 关注：1

2023-02-03 11:07阅读: 486评论: 0推荐: 0

[概率论与数理统计]笔记：5.4 假设检验概述

5.4 假设检验概述

假设检验问题的提法

基本概述

在实际问题中，总体分布通常是未知的，可能是分布的类型未知，也可能是分布的相关参数未知，比如已知是正态分布，但是不知道参数 $μ, σ^{2}$ 是多少。

于是总体分布未知可以分为类型未知和参数未知两种情况。

对于这些未知，我们可以提出一种推断，比如说”假设总体服从正态分布“，或者说”假设正态分布的 $μ$ 是100“，这些推断叫做假设。

因为参数未知进行的推断叫做参数假设，而对其他未知比如类型未知进行的推断叫做非参数假设。

假设之后，我们需要使用样本来证明我们推断的准确性，这个过程叫做假设检验。

对参数假设进行的检验叫做参数假设检验，对非参数假设进行的检验叫做非参数假设检验。

假设

待检验的假设称为原假设或零假设，记作 $H_{0}$ .
与之对立的假设称为备择假设或对立假设，记作 $H_{1}$ .

二者是二选一，接受其中一个假设就意味着拒绝另一个假设。

一个假设检验问题通常简记为 $H_{0} \leftrightarrow H_{1}$ .

案例

有一新工艺，不知道是否能提高生产效率，那么 $H_{0}$ 可以是"生产效率不变"，而 $H_{1}$ 是”新工艺使得生产效率提高“。

$H_{0}$ 可以理解为研究者想要推翻的结论， $H_{1}$ 是研究者想要证明的结论。

这个案例可以简记为： $H_{0} : 生产效率不变 \leftrightarrow H_{1} : 生产效率提高$ .

假设检验问题

显著性假设检验问题——只提出唯一假设 $H_{0}$
$H_{0}$ 对 $H_{1}$ 假设检验问题——提出两个假设

基本思想与原理

小概率原理

小概率事件在一次试验中不太可能发生。

论证逻辑

如果 $H_{0}$ 成立导致了小概率事件发生，那么我们就拒绝假设 $H_{0}$ . (即怀疑该假设的准确性)

基本概念

显著性水平 $α$ ：在假设检验问题中，小概率事件发生的概率，是事先指定的一个很小的正数。
拒绝域：小概率事件对应的样本的取值区域。

当有样本观察值落在拒绝域内，就说明发生了小概率事件，于是便拒绝零假设。

假设检验与置信区间

假设检验与置信区间都需要构造枢轴量。

在求解置信区间的时候，枢轴量有一个未知的 $μ$ 或者 $σ^{2}$ 需要求解，关注的是概率为 $1 - α$ 的大概率事件。

而假设检验的时候，枢轴量中的 $μ$ 或 $σ^{2}$ 会代入 $H_{0}$ 假设的数值，然后再根据样本的实际观察值检验是否落在拒绝域内，关注的是概率为 $α$ 的小概率事件。

基本思想

构造一个含待检验参数和分布已知的枢轴量 $T$ ，在假设 $H_{0}$ 成立的条件下，确定拒绝域。
检验法则：小概率事件是否发生。
- $P {(X_{1}, X_{2}, \dots, X_{n}) \in W} = α$ 对应小概率事件，其中 $W$ 称为 $H_{0}$ 的拒绝域。
- $P {(X_{1}, X_{2}, \dots, X_{n}) \in \overset{―}{W}} = 1 - α$ 对应大概率事件，其中 $\overset{―}{W}$ 对应 $H_{0}$ 的接受域。

假设检验的一般步骤

第1步：提出 $H_{0} \leftrightarrow H_{1}$ .

第2步：假设 $H_{0}$ 成立，构造枢轴量 $T$ ，确定其分布。

第3步：对于给定的 $α$ ，根据 $P {(X_{1}, X_{2}, \dots, X_{n}) \in W} = α$ 求解确定拒绝域 $W$ .

第4步：由样本数据 $(x_{1}, x_{2}, \dots, x_{n})$ 求出统计量 $T$ 的值：

如果 $(x_{1}, x_{2}, \dots, x_{n}) \in W$ ，则拒绝 $H_{0}$ ，接受 $H_{1}$ .
如果 $(x_{1}, x_{2}, \dots, x_{n}) \in \overset{―}{W}$ ，则接受 $H_{0}$ ，拒绝 $H_{1}$ .

两类错误

在假设检验中，我们通过样本来检验假设的准确性。

而抽样具有随机性，并且有时样本容量过小，或者其他原因，都会导致最终的推断可能出现错误。

统计推断是具有误差的，比如天气预报。

第一类错误

弃真： $H_{0}$ 是成立的，但是被拒绝了。

犯第一类错误的概率记为：

P {拒 绝 H_{0} | H_{0} 为 真} = α

这里的 $α$ 记号和上文的小概率事件的概率不是同一个记号。

第二类错误

纳伪/取伪： $H_{0}$ 不成立，但是被接受了。

犯第二类错误的概率记为：

P {接 受 H_{0} | H_{0} 为 假} = β

目标与现实

我们希望 $α$ 和 $β$ 越小越好，但是在实际问题中很难做到同时降低两个错误率，除非将样本容量 $n$ 无限加大，而实际问题中抽样是需要成本的，所以很难同时降低 $α$ 和 $β$ 。

通常，我们更重视 $α$ ，在 $α$ 很小的前提下，再尽量降低 $β$ .

思路：宁信其有，不信其无，或者说严重点记作宁可杀错不可放过。

案例：

某刑事案件中有犯人1个，但是只要是有嫌疑的人都会被调查访问。

在这个案例中，第一类错误就是把犯人放跑了，即弃真；第二类错误是只要有嫌疑的人都会被调查，不管其是否真的是犯人，即纳伪。显然我们更关注的是真的那个犯人，所以我们的首要任务是要把第一类错误的错误率压下去，即只要是有嫌疑的人都要被调查访问。
体检：不确定身体有没有问题？那就检查一下。

我们不希望“生病了但是不知道自己生病了”，也就是不希望出现第一类错误。就算是没有的病，体检的时候也要检查一下，所以第二类错误在这个案例中是无关紧要的。

使用教材：
《概率论与数理统计》第四版中国人民大学龙永红主编高等教育出版社

上一篇[概率论与数理统计]笔记：5.3 置信区间

下一篇[概率论与数理统计]笔记：5.5 单正态总体的参数假设检验

本文作者：feixianxing

本文链接：https://www.cnblogs.com/feixianxing/p/overview-of-hypothesis-testing.html

posted @ 2023-02-03 11:07 feixianxing 阅读(486) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

feixianxing

[概率论与数理统计]笔记：5.4 假设检验概述

5.4 假设检验概述

假设检验问题的提法

基本概述

假设

假设检验问题

基本思想与原理

小概率原理

论证逻辑

基本概念

假设检验与置信区间

基本思想

假设检验的一般步骤

两类错误

第一类错误

第二类错误

目标与现实

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论