【机器学习基础】数据集的划分比例

前言

 

1)如果数据集较小(传统机器学习)时,一般采用简单交叉验证的方法,即不设置验证集,而只设置训练集和测试集.

根据西瓜书的观点,训练集和测试集的比例设置一般为 2:1 ~ 4:1 。根据目前所看到的方法,大多数将比例设置为7:3。

2)数据量较大(比如万级)
没有验证集,训练集:测试集=7:3;有验证集,训练集:验证集:测试集=6:2:2;
3)在深度学习中若是数据很大(比如百万级、亿级),我们可以将训练集、验证集、测试集比例调整为98:1:1

 

参考

1. 机器学习 :训练集、验证集、测试集分配比例_Chris Kang的博客-CSDN博客

posted on 2023-04-28 14:34  鹅要长大  阅读(2064)  评论(0编辑  收藏  举报

导航