2018年1月18日

复现梯度爆炸与梯度消失

摘要: 在训练rnn模型时,很可能会遇到一段时间后,无论怎么训练,损失函数都不变化的情况.仿佛时间静止了一样.这时候很可能是大多数参数都不变了.也就是遇到了梯度消失的问题. 原理 令 $$ \begin{equation } \sigma(x)=\frac{1}{1+e^{ x}} \end{equatio 阅读全文

posted @ 2018-01-18 17:57 荷楠仁 阅读(771) 评论(0) 推荐(0) 编辑

导航