摘要: 多层双向GRU 参考: "博客" RNN在使用过程中会出现梯度爆炸 (exploding gradients) 和梯度消失 (vanishing gradients) 两种问题: 梯度爆炸 这个问题通常出现在深度神经网络中 (多层网络),当使用梯度回传时,梯度可能会爆炸。这个问题可以使用 gradi 阅读全文
posted @ 2019-05-08 10:34 静_渊 阅读(2629) 评论(0) 推荐(0) 编辑