摘要:
一、GRU 首先需要明确的是,GRU出现的时间是在LSTM之后的,其实为了简化LSTM而产生的,由于其简易型,一般都会先进行介绍。 首先来看一下RNN的示意图,如下。这里不做解释。 下图是GRU的示意图,相较于RNN似乎复杂了许多。其只是增加了一个cell来存储需要远程传递的信息以及相应的gate来 阅读全文
摘要:
在构建语言模型中,我们需要理解n元模型、架构以及梯度裁剪。 阅读全文
摘要:
循环神经网络的前向传播和反向传播。 阅读全文