几种优化器对比？

神经网络优化器对比

待优化参数w,损失函数loss,学习率lr，每次迭代一个batch，，每次迭代一个batch,t表示当前batch迭代的总次数。

1、计算t时刻损失函数关于当前参数的梯度

2、计算t时刻一阶动量和二阶动量

3、计算t时刻下降梯度：

4、计算t+1时刻参数：

一阶动量：与梯度相关的函数

二阶动量：与梯度平方相关的函数

不同的优化器实际上只是定义了不同的一阶动量和二阶动量公式。

SGD(随机梯度下降)无momentum,常用的梯度下降法

SGDM(含momentum的SGD),在SGD基础上增加一阶动量。

表示各时刻梯度方向的指数滑动平均值。

0时刻m_w, m_b=0 , 0

Beta = 0.9 #超参数

# SGD-Momentun

Adagrad,在SGD基础上增加二阶动量

Adagrad

v_w ,v_b = 0,0

# adagrad

v_w += tf.square(grads[0])

v_b += tf.square(grads[1])

w1.assign_sub(lr*grads[0]/tf.sqrt(v_w))

b1.assign_sub(lr*grads[1]/tf.sqrt(v_b))

RMSProp，SGD基础上增加二阶动量

RMSProp

##

v_w = beta * v_w + (1-beta)*tf.square(grads[0])

v_b = beta * v_b + (1-beta)*tf.square(grads[1])

w1.assign_sub(lr * grads[0] / tf.sqrt(v_w))

b1.assign_sub(lr * grads[1] / tf.sqrt(v_b))

Adam,

同时结合SGDM一阶和RMSProp二阶动量

修正一阶动量的偏差：

修正二阶动量的偏差：

Adam

m_w , m_b = 0 , 0

v_w, v_b = 0, 0

beta1,beta2 = 0.9 ,0.999

delta_w,delta_b = 0, 0

global_step = 0

m_w = beta1 * m_w + (1-beta1) * grads[0]

m_b = beta1 * m_b + (1-beta1) * grads[1]

v_w = beta2 * v_w + (1-beta2) * tf.square(grads[0])

v_b = beta2 * v_b + (1-beta2) * tf.square(grads[1])

m_w_correction = m_w / (1-tf.pow(beta1,int(global_step)))

m_b_correction = m_b / (1-tf.pow(beta1,int(global_step)))

v_w_correction = v_w / (1-tf.pow(beta2,int(global_step))

v_b_correction = v_b / (1-tf.pow(beta2,int(global_step))

w1.assign_sub(lr * m_w_correction / tf.sqrt(v_w_correction)

b1.assign_sub(lr * m_b_correction / tf.sqrt(v_b_correction)

各优化器 loss 图对比

ACC 图对比

训练耗时

posted @ 2022-03-04 14:02 宋禹臣阅读(343) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 激活函数学习总结

· 为什么加入Batchnormalization？

· 优化器Optimal

· 深度学习的优化算法

· 优化算法小结

阅读排行：
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾（3.3-3.9）
· winform 绘制太阳，地球，月球运作规律

公告

昵称：宋禹臣
园龄： 3年
粉丝： 0
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜