摘要: 为什么使用序列模型(sequence model)?标准的全连接神经网络(fully connected neural network)处理序列会有两个问题:1)全连接神经网络输入层和输出层长度固定,而不同序列的输入、输出可能有不同的长度,选择最大长度并对短序列进行填充(pad)不是一种很好的方式;2)全连接神经网络同一层的节点之间是无连接的,当需要用到序列之前时刻的信息时,全连接神经网络无法办到,一个序列的不同位置之间无法共享特征。而循环神经网络(Recurrent Neural Network,RNN)可以很好地解决问题。本文介绍了RNN的结构,对RNN前向传播过程进行了剖析。此外对GRU和LSTM也进行了简单介绍。 阅读全文
posted @ 2018-08-22 20:59 wuliytTaotao 阅读(7123) 评论(0) 推荐(1) 编辑