转:batch normalization, instance normalization, layer normalization, group normalization

batch normalization, instance normalization, layer normalization, group normalization (知乎)

batch normalization, instance normalization, layer normalization, group normalization比较 (博客)

Transformer 使用 LayerNorm 不用 BatchNorm的原因 (CSDN)

Batch Normalization 强行让一个batch的数据的某个channel的数据分布符合高斯分布。

Layer Normalization 强行让一个数据的所有channel的数据分布符合高斯分布。

 

layer normalization详细介绍:

模型优化之Layer Normalization

论文阅读笔记:Layer Normalization

 

posted @ 2021-05-27 16:18  Picassooo  阅读(75)  评论(0编辑  收藏  举报