RMSprop:

全称为root mean square prop,提及这个算法就不得不提及上篇博文中的momentum算法

首先来看看momentum动量梯度下降法的过程:

在RMSprop中:

Compute dW,db on the current mini-batch

SdW = βSdW  +  (1-β)dW2

Sdb  = βSdb +  (1-β)db2

W = W - α(dW / sqrt.SdW+ε),b = b - α(db / sqrt.Sdb+ε)

所以也就是说RMSprop就是对动量梯度下降法中的dw和db每次除根号下的SdW和Sdb变形即可

注意:为了防止根号下的SdW和Sdb可能无限接近于0的情况,加上了一个很小的ε值即可,通常取ε=10-8

posted on 2019-07-16 15:49  NWNU-LHY  阅读(178)  评论(0编辑  收藏  举报