摘要: 处理长序列 在长序列上训练一个RNN,必须运行很多时间步长,从而展开的RNN成为一个非常深的网络。就像任何深度神经网络一样,它可能会遇到不稳定的梯度问题:它可能永远在训练,或者训练可能会不稳定。此外,当RNN处理一个长序列时,它会逐渐忘记序列中的第一个输入。 应对不稳定梯度问题 在深度网络中用于应对 阅读全文
posted @ 2021-12-13 16:29 里列昂遗失的记事本 阅读(254) 评论(0) 推荐(0) 编辑