神经网络的使用要点(吴恩达)
1 数据集的分割
对于样本量小的数据集,经典的分割方式是7:3或6:2:2
对于样本量大的数据集,可以分割为98:1:1甚至更小
一言蔽之,关键是保证足够量的测试集和尽可能大的训练集
2 训练结果的评估
在训练集上误差大叫偏差大(bias),在验证集上误差大叫方差大(variance)
a. 假如偏差大,则可能出现欠拟合,即对于训练集的拟合仍不足。
此时可以选择:
① 换一个网络模型
② 加深模型隐藏层层数
③ 加长训练时长
b. 假如方差大,则可能出现过拟合,即对于训练集的拟合过头导致对验证集拟合欠缺。
此时可以选择:
① 扩充数据集(首选)
② 正则化