摘要: 一、GRU 首先需要明确的是,GRU出现的时间是在LSTM之后的,其实为了简化LSTM而产生的,由于其简易型,一般都会先进行介绍。 首先来看一下RNN的示意图,如下。这里不做解释。 下图是GRU的示意图,相较于RNN似乎复杂了许多。其只是增加了一个cell来存储需要远程传递的信息以及相应的gate来 阅读全文
posted @ 2020-03-06 22:57 金思远 阅读(733) 评论(0) 推荐(0) 编辑
摘要: 在构建语言模型中,我们需要理解n元模型、架构以及梯度裁剪。 阅读全文
posted @ 2020-03-06 16:39 金思远 阅读(466) 评论(0) 推荐(0) 编辑
摘要: 循环神经网络的前向传播和反向传播。 阅读全文
posted @ 2020-03-06 16:23 金思远 阅读(586) 评论(0) 推荐(0) 编辑