摘要: 《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》 1、Batch Normalization 并不能缓解深度网络梯度爆炸问题,反而是梯度爆炸的原因。一般通多跳跃 阅读全文
posted @ 2022-05-19 22:29 九叶草 阅读(67) 评论(0) 推荐(0) 编辑