随笔- 380 文章- 0 评论- 18 阅读- 35万

14、模型评估中常用的验证方法

在机器学习中，我们通常把样本分为训练集和测试集，训练集用于训练模型，测试集用于评估模型。在样本划分和模型验证的过程中，存在着不同的抽样方法和验证方法。

1）Holdout检验
Holdout 检验是最简单也是最直接的验证方法，它将原始的样本集合随机划分成训练集和验证集两部分。比方说，对于一个点击率预测模型，我们把样本按照70%～30% 的比例分成两部分，70% 的样本用于模型训练；30% 的样本用于模型验证，包括绘制ROC曲线、计算精确率和召回率等指标来评估模型性能。
缺点：在验证集上计算出来的最后评估指标与原始分组有很大关系。

2）交叉检验
k-fold交叉验证：首先将全部样本划分成k个大小相等的样本子集；依次遍历这k个子集，每次把当前子集作为验证集，其余所有子集作为训练集，进行模型的训练和评估；最后把k次评估指标的平均值作为最终的评估指标。在实际实验中，k经常取10。
留一验证：每次留下1个样本作为验证集，其余所有样本作为测试集。样本总数为n，依次对n个样本进行遍历，进行n次验证，再将评估指标求平均值得到最终的评估指标。在样本总数较多的情况下，留一验证法的时间开销极大。事实上，留一验证是留p验证的特例。
留p验证:每次留下p个样本作为验证集，而从n个元素中选择p个元素有C(p,n)种可能，因此它的时间开销更是远远高于留一验证，故而很少在实际工程中被应用。

3) 自助法：
不管是Holdout检验还是交叉检验，都是基于划分训练集和测试集的方法进行模型评估的。然而，当样本规模比较小时，将样本集进行划分会让训练集进一步减小，这可能会影响模型训练效果。有没有能维持训练集样本规模的验证方法呢？自助法可以比较好地解决这个问题。

自助法是基于自助采样法的检验方法。对于总数为n的样本集合，进行n次有放回的随机抽样，得到大小为n的训练集。n次采样过程中，有的样本会被重复采样，有的样本没有被抽出过，将这些没有被抽出的样本作为验证集，进行模型验证，这就是自助法的验证过程。

当样本无穷大时，使用自助法有多少样本未被选择：
一个样本一次抽中概率为1-1/n，n次未抽中的概率为（1-1/n)^n，

参考：

https://zhuanlan.zhihu.com/p/429901476

posted @ 2022-06-29 20:26 合唱团abc 阅读(673) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 15、样本不均衡

· 13、模型数据缺失值的处理

· 模型评估与选择

· 训练集验证集测试集

· 划分出测试集的三种方法

阅读排行：
· 25岁的心里话
· 闲置电脑爆改个人服务器（超详细） #公网映射 #Vmware虚拟网络编辑器
· 零经验选手，Compose 一天开发一款小游戏！
· 通过 API 将Deepseek响应流式内容输出到前端
· 因为Apifox不支持离线，我果断选择了Apipost！

历史上的今天：
2016-06-29 python异步回调函数的实现

公告

昵称：合唱团abc
园龄： 10年8个月
粉丝： 34
关注： 8

+加关注

2025年3月

日

一

二

三

四

五

六

合唱团abc

14、模型评估中常用的验证方法

公告

搜索

常用链接

我的标签

随笔分类 (377)

随笔档案 (380)

阅读排行榜

评论排行榜

推荐排行榜

最新评论