会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Parallax
初极狭,才通人;复行数十步,豁然开朗。
博客园
首页
新随笔
联系
订阅
管理
L1损失函数和L2损失函数
L1损失函数:最小化
绝对误差
,因此L1损失对异常点有较好的适应更鲁棒,不可导,有多解,解的稳定性不好。
关于L1损失函数的不连续的问题,可以通过平滑L1损失函数代替:
L2损失函数:最小化
平方误差
,因此L2损失
对异常点敏感
,L2损失函数会赋予异常点更大的损失值和梯度,调整网络参数向减小异常点误差的方向更新,因此容易造成
训练的不稳定和发散
。仅有一解,解的稳定更好。
posted @
2019-05-11 00:56
Parallax
阅读(
972
) 评论(
0
)
编辑
收藏
举报
刷新页面
返回顶部
公告