训练集 验证集 测试集
训练集:训练数据
验证集:得出模型的精度等一系列数据用于改进模型
测试集:得到模型的精度等一系列数据用于发表论文等。。。
如果数据量比较小可以把验证集和测试集合并
一般来说 验证集和测试集各1k个样本就够了
其他的全部丢到训练集去吧
比如我们现在要训练猫的分类器
然后我们有一个app,模型的最终目标是分类app拍出来的照片
而app拍出来的照片会比较模糊
现在的训练数据是我们有2k张app拍出来的照片 A
1w张网络爬虫爬出来的照片 B
这试我们应训练集:B + 1000张A中的照片
验证集:剩下的A中的照片
因为我们是通过验证集来评价网络,调整网络的
所以验证集中必须是我们要的东西