【机器学习基础】数据集的划分比例

前言

 

1)如果数据集较小(传统机器学习)时,一般采用简单交叉验证的方法,即不设置验证集,而只设置训练集和测试集.

根据西瓜书的观点,训练集和测试集的比例设置一般为 2:1 ~ 4:1 。根据目前所看到的方法,大多数将比例设置为7:3。

2)数据量较大(比如万级)
没有验证集,训练集:测试集=7:3;有验证集,训练集:验证集:测试集=6:2:2;
3)在深度学习中若是数据很大(比如百万级、亿级),我们可以将训练集、验证集、测试集比例调整为98:1:1

 

参考

1. 机器学习 :训练集、验证集、测试集分配比例_Chris Kang的博客-CSDN博客

posted on   鹅要长大  阅读(2731)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】
历史上的今天:
2021-04-28 【leetcode_easy_math】892. Surface Area of 3D Shapes

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示