欠拟合、过拟合判断方法

什么是欠拟合

训练样本被提取的特征比较少,导致训练出来的模型不能很好地匹配,表现得很差,甚至样本本身都无法高效的识别

什么是过拟合

所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在验证数据集以及测试数据集中表现不佳。过拟合就是学到了很多没必要的特征,遇到了新样本这些错误的特征就没有什么用了。所以过拟合就是表现为训练的时候效果很好(因为神经网络已经学到了很多有用没用的特征),但是在测试样本上的效果就很差(有的特征完全没用啊,完全就是为了降低loss而得出来的特征)。至于为什么会产生过拟合,一般是因为参数过多,为了降低loss(神经网络的任务就是为了最小化loss),后者样本过少。总之就是参数/样本的比太大。

判断方法

从训练集中随机选一部分作为一个验证集,采用K折交叉验证的方式,用训练集训练的同时在验证集上测试算法效果。下图的横坐标用拟合函数多项式的阶数笼统地表征模型拟合能力:

在缺少有效预防欠拟合和过拟合措施的情况下,随着模型拟合能力的增强,错误率在训练集上逐渐减小,而在验证集上先减小后增大;Error = Bias + Variance

  • 当两者的误差率都较大时,处于欠拟合状态(high bias, low variance);
  • 当验证集误差率达到最低点时,说明拟合效果最好;
  • 由最低点增大时,处与过拟合状态(high variance, low bias)。

参考

https://blog.csdn.net/weixin_42575020/article/details/82949285

posted @ 2020-11-07 22:30  小帆敲代码  阅读(2225)  评论(0编辑  收藏  举报