摘要: 上一篇文章介绍了RNN的工作原理和在图像标注上的应用,这篇介绍RNN的变体LSTM。 要知道为什么会出现LSTM,首先来看RNN存在什么问题。RNN由于激活函数和本身结构的问题,存在梯度消失的现象,导致 (1)网络结构不能太深,不然深层网络的梯度可以基本忽略,没有起到什么作用,白白增加训练时间。 ( 阅读全文
posted @ 2018-09-01 23:48 Super_JJboom 阅读(4166) 评论(0) 推荐(0) 编辑