摘要: from:https://zhuanlan.zhihu.com/p/44163528 哪些问题? 梯度消失会导致我们的神经网络中前面层的网络权重无法得到更新,也就停止了学习。 梯度爆炸会使得学习不稳定, 参数变化太大导致无法获取最优参数。 在深度多层感知机网络中,梯度爆炸会导致网络不稳定,最好的结果 阅读全文
posted @ 2019-03-05 11:08 bonelee 阅读(39902) 评论(1) 推荐(5) 编辑