摘要: 网上找了下tensorflow中使用batch normalization的博客,发现写的都不是很好,在此总结下: 1.原理 公式如下: y=γ(x-μ)/σ+β 其中x是输入,y是输出,μ是均值,σ是方差,γ和β是缩放(scale)、偏移(offset)系数。 一般来讲,这些参数都是基于chann 阅读全文
posted @ 2017-07-27 14:05 handspeaker 阅读(75357) 评论(21) 推荐(0) 编辑