深度学习-学习率

学习率 (learning rate)，控制模型的学习进度
lr 即 stride (步长)

学习率设置

在训练过程中，一般根据训练轮数设置动态变化的学习率。

刚开始训练时：学习率以 0.01 ~ 0.001 为宜。
一定轮数过后：逐渐减缓。
接近训练结束：学习速率的衰减应该在100倍以上。

如果是迁移学习，由于模型已在原始数据上收敛，此时应设置较小学习率 (≤10−4≤10−4) 在新数据上进行微调。
学习率减缓机制

	轮数减缓	指数减缓	分数减缓
英文名	step decay	exponential decay	1/t1/t decay
方法	每N轮学习率减半	学习率按训练轮数增长指数插值递减	lrt=lr0/(1+kt)lrt=lr0/(1+kt) ，kk 控制减缓幅度，tt 为训练轮数

理想情况下曲线应该是滑梯式下降 [绿线]：

posted on 2020-07-26 14:18 耀扬阅读(601) 评论(0) 收藏举报

刷新页面返回顶部