摘要: 背景:深度神经网络涉及到很多层的叠加,而每一层的参数更新会导致上层的输入数据分布发生变化,通过层层叠加,高层的输入分布变化会非常剧烈,这就使得高层需要不断去重新适应底层的参数更新。Google 将这一现象总结为 Internal Covariate Shift,简称 ICS. 所以ICS是什么呢?将 阅读全文
posted @ 2021-12-06 20:29 合唱团abc 阅读(168) 评论(0) 推荐(0) 编辑