2017 年 12月 14 日随笔档案 - AYE89

2017年12月14日

深层模型优化与训练

摘要：一、梯度下降最简单的梯度下降算法——固定学习率 x -= grad*lr 步长的选择：步长太小对局部极小值的逼近慢，训练时间长步长太大，模型容易震荡，结果不收敛二、Adam法梯度下降动量法梯度下降：(当前更新量+之前值 )的平滑冲量的“惯性” pre_grad = pre_grad*di 阅读全文

posted @ 2017-12-14 18:48 AYE89 阅读(395) 评论(0) 推荐(0) 编辑

AYE89

导航

公告

深层模型优化与训练