一、Loss加入L2正则对参数的影响

根据在最优解处的泰勒展开,L2正则化会让某些参数缩小,但不会到0

 

二、为什么参数缩小可以减少过拟合

过拟合的函数在小区间里变化剧烈,这就需要有很大的导数,由于自变量的值可大可小,只有系数特别大才能保证导数很大