进行机器学习模型训练和评估时,经常碰到三种类型的数据集:训练集、验证集和测试集。这三种数据集的区别是什么呢?

  • 训练集。用于训练模型,调整模型内部参数,使模型尽可能的拟合其数据样本;
  • 验证集。用于调整模型的超参数和对模型的能力进行初步评估,以决定是否停止继续训练;
  • 测试集。评估最终模型的泛化能力,只能使用一次。

有一个比喻可以很贴切的形容这三者之间的关系:训练集相当于课后练习;验证集相当于周考;测试集相当于期末考试。

本人研究牲一枚,请各位大佬批评指正~

 

posted on 2023-03-07 21:30  BeLady  阅读(162)  评论(0编辑  收藏  举报