Toriyung

导航

神经网络优化:RMSprop(均方根传播梯度下降法)

最终目的仍是减少振荡方向(b)的更新幅度,提高前进方向(ω)的更新幅度

引入S和Sdb,如公式表达,由于dω<db,求其均方根作为分母,实现ω的更新幅度大,而b的更新幅度小

 

 

注意

  1. 使用中为了避免出现√S=0导致除数为0的情况出现,应令√(S+ε) (吴恩达视频中建议ε=1e-8)

  2. 与动量梯度下降法一样,需要对S进行修正:S = S/(1-βt)

posted on 2022-07-31 15:22  Toriyung  阅读(683)  评论(0编辑  收藏  举报