摘要: 1.使用L1,L2正则化防止过拟合的原理 L1正则化是使得那些原先在0附近的权重参数W往零移动,从而减弱那些可能是某些批次数据所特有的特征对网络模型的影响,它偏向于产生少量的特征。L2正则化起到使得权重参数W变小加巨的效果,从而降低网络模型的复杂度,W的减小会使得激活函数的取值范围减小,一定程度上会 阅读全文
posted @ 2019-06-01 14:18 喂你在哪 阅读(433) 评论(0) 推荐(0) 编辑