摘要: 一、基本概念 RNN前向传播图 对应的前向传播公式和每个时刻的输出公式 $S_{t}=tanh(UX_t+WS_{t-1}) \qquad \qquad {y_t}'=softmax(VS_t)$ 使用交叉熵为损失函数,对应的每个时刻的损失和总的损失。通常将一整个序列(一个句子)作为一个训练实例,所 阅读全文
posted @ 2020-03-07 11:25 suwenyuan 阅读(2176) 评论(0) 推荐(0) 编辑