Toriyung

导航

神经网络的使用要点(吴恩达)

1 数据集的分割

对于样本量小的数据集,经典的分割方式是7:3或6:2:2

对于样本量大的数据集,可以分割为98:1:1甚至更小

一言蔽之,关键是保证足够量的测试集和尽可能大的训练集

2 训练结果的评估

在训练集上误差大叫偏差大(bias),在验证集上误差大叫方差大(variance)

a. 假如偏差大,则可能出现欠拟合,即对于训练集的拟合仍不足。

此时可以选择:

  ① 换一个网络模型

  ② 加深模型隐藏层层数

  ③ 加长训练时长

b. 假如方差大,则可能出现过拟合,即对于训练集的拟合过头导致对验证集拟合欠缺。

此时可以选择:

  ① 扩充数据集(首选)

  ② 正则化

 

 

 

    

posted on 2022-07-29 20:59  Toriyung  阅读(59)  评论(0编辑  收藏  举报