为什么要归一化？

为什么要归一化？#

BN是Batch Normalization的缩写，该方法的代表性论文是“Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift”，论文中关于BN的解释是训练深度神经网络非常复杂,因为在训练过程中,随着先前各层的参数发生变化,各层输入的分布也会发生变化,图层输入分布的变化带来了一个问题,因为图层需要不断适应新的分布,因此训练变得复杂,随着网络变得更深,网络参数的细微变化也会放大。

由于要求较低的学习率和仔细的参数初始化,这减慢了训练速度,并且众所周知,训练具有饱和非线性的模型非常困难。我们将此现象称为内部协变量偏移,并通过归一化层输入来解决该问题。

如上图中的左图所示,由于两个数据不在同一范围,但它们是使用相同的学习率,导致梯度下降轨迹沿一维来回振荡,从而需要更多的步骤才能达到最小值。且此时学习率不容易设置,学习率过大则对于范围小的数据来说来回震荡,学习率过小则对范围大的数据来说基本没什么变化。如上图中的右图所示,当进行归一化后,特征都在同一个大小范围,则loss landscape像一个碗,学习率更容易设置,且梯度下降比较平稳。

我的理解就是看图，防止不同维度的尺度不一致，在梯度下降的时候被尺度大的维度主导。

posted @ 2023-06-27 16:15 攻城狮？阅读(44) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 深度学习 (一)通用知识

· CenterNet：Objects as Points论文精读

· Normalization小结

· batchnorm（Batch Normalization）

· 归一化层(BN/LN/IN/GN)

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· .NET10 - 预览版1新功能体验（一）

公告

昵称：攻城狮？
园龄： 6年
粉丝： 2
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

攻城狮？

为什么要归一化？

为什么要归一化？#

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔分类 (9)

随笔档案 (35)

阅读排行榜

推荐排行榜