机器学习领域中假设检验的使用

前文已经讨论了关于置信区间的问题,具体见:

机器学习领域中置信区间的使用

 

本文讨论假设检验的相关问题。

 

基本概念:

样本(一般指样本集合):一次从总体抽样中获得的样本集合。

样本量/样本个数:一次从总体抽样中获得的样本集合的样本数目。

抽样个数(一般指放回抽样):总共从总体中抽取样本的次数,每次抽取的都是一个样本集合。

 

 

===============================

 

 

对于假设检验是什么就不作介绍了,本文主要是介绍在机器学习领域一般对假设检验的使用,这里主要参考:

 

作为非统计专业的同学,关于置信区间,你需要了解什么?

由于假设检验与置信区间在本质上是相同的,基础就是置信区间,为此给出上面链接中的一个置信区间的分类图:

 

 

就像前文机器学习领域中置信区间的使用中给出的例子,我们可以通过对总体的抽样计算出总体的某个置信度下的置信区间,而该种形式是对总体期望的评估,使用局限性很大,而在机器学习领域中我们使用更多的是对两个总体的差异评估,比如:某个原始算法试验m次后获得抽样数据,其样本均值为X_bar,方差为S1;该原始算法的改进算法试验n次后获得抽样数据,其均值为Y_bar,方差为S2;那么我们就可以使用T检验来判断改进后的算法性能是否得到了提升。

 

 

posted on   Angry_Panda  阅读(178)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2020-12-06 【转载】 CNN训练Cifar-10技巧
2020-12-06 【转载】 ReLu(Rectified Linear Units)激活函数

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示