机器学习领域中假设检验的使用

前文已经讨论了关于置信区间的问题,具体见:

机器学习领域中置信区间的使用

 

本文讨论假设检验的相关问题。

 

基本概念:

样本(一般指样本集合):一次从总体抽样中获得的样本集合。

样本量/样本个数:一次从总体抽样中获得的样本集合的样本数目。

抽样个数(一般指放回抽样):总共从总体中抽取样本的次数,每次抽取的都是一个样本集合。

 

 

===============================

 

 

对于假设检验是什么就不作介绍了,本文主要是介绍在机器学习领域一般对假设检验的使用,这里主要参考:

 

作为非统计专业的同学,关于置信区间,你需要了解什么?

由于假设检验与置信区间在本质上是相同的,基础就是置信区间,为此给出上面链接中的一个置信区间的分类图:

 

 

就像前文机器学习领域中置信区间的使用中给出的例子,我们可以通过对总体的抽样计算出总体的某个置信度下的置信区间,而该种形式是对总体期望的评估,使用局限性很大,而在机器学习领域中我们使用更多的是对两个总体的差异评估,比如:某个原始算法试验m次后获得抽样数据,其样本均值为X_bar,方差为S1;该原始算法的改进算法试验n次后获得抽样数据,其均值为Y_bar,方差为S2;那么我们就可以使用T检验来判断改进后的算法性能是否得到了提升。

 

 

posted on 2022-12-06 15:46  Angry_Panda  阅读(159)  评论(0编辑  收藏  举报

导航