2020年4月1日

最优化算法Nesterov Momentum牛顿动量法

摘要: 这是对之前的Momentum的一种改进,大概思路就是,先对参数进行估计,然后使用估计后的参数来计算误差 具体实现: 需要:学习速率 ϵ, 初始参数 θ, 初始速率v, 动量衰减参数α每步迭代过程: 阅读全文

posted @ 2020-04-01 19:05 limingqi 阅读(1098) 评论(0) 推荐(0) 编辑

最优化算法动量法Momentum

摘要: 动量法的结论: 1.动量方法主要是为了解决Hessian矩阵病态条件问题(直观上讲就是梯度高度敏感于参数空间的某些方向)的。 2.加速学习 3.一般将参数设为0.5,0.9,或者0.99,分别表示最大速度2倍,10倍,100倍于SGD的算法。 4.通过速度v,来积累了之间梯度指数级衰减的平均,并且继 阅读全文

posted @ 2020-04-01 18:43 limingqi 阅读(2126) 评论(0) 推荐(0) 编辑

导航