随笔- 1895 文章- 0 评论- 6 阅读- 446万

深度学习: 学习率 (learning rate)

Introduction

学习率 (learning rate)，控制模型的 学习进度 ：

lr 即 stride (步长) ，即反向传播算法中的 ηη ：

ωn←ωn−η∂L∂ωnωn←ωn−η∂L∂ωn

学习率大小

	学习率大	学习率小
学习速度	快	慢
使用时间点	刚开始训练时	一定轮数过后
副作用	1.易损失值爆炸；2.易振荡。	1.易过拟合；2.收敛速度慢。

学习率设置

在训练过程中，一般根据训练轮数设置动态变化的学习率。

刚开始训练时：学习率以 0.01 ~ 0.001 为宜。
一定轮数过后：逐渐减缓。
接近训练结束：学习速率的衰减应该在100倍以上。

Note：
如果是 迁移学习 ，由于模型已在原始数据上收敛，此时应设置较小学习率 (≤10−4≤10−4) 在新数据上进行微调。

把脉目标函数损失值曲线

理想情况下曲线应该是 滑梯式下降 [绿线]：

1. 曲线初始时上扬 [红线]： Solution：初始学习率过大导致振荡，应减小学习率，并从头开始训练。
2. 曲线初始时强势下降没多久归于水平 [紫线]： Solution：后期学习率过大导致无法拟合，应减小学习率，并重新训练后几轮。

3. 曲线全程缓慢 [黄线]： Solution：初始学习率过小导致收敛慢，应增大学习率，并从头开始训练。

posted @ 2019-07-30 15:39 Avatarx 阅读(10330) 评论(0) 编辑收藏举报

刷新页面返回顶部

（评论功能已被禁用）

历史上的今天：
2017-07-30 ODB Examples
2017-07-30 linux 下一步一步安装odb
2017-07-30 fedora18 You might need to install dependency packages for libxcb.

公告

昵称： Avatarx
园龄： 11年1个月
粉丝： 448
关注： 10

+加关注

2025年3月

日

一

二

三

四

五

六

Avatarx

此博客专攻计算机语言。

深度学习: 学习率 (learning rate)

Introduction

学习率大小

学习率设置

把脉目标函数损失值曲线

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

此博客专攻计算机语言。

Introduction

学习率大小

学习率设置

把脉 目标函数损失值 曲线

公告

搜索

常用链接

随笔档案

把脉目标函数损失值曲线