l1和l2正则化的区别 - 面试错题集

L0:计算非零个数,用于产生稀疏性,但是在实际研究中很少用,因为L0范数很难优化求解,是一个NP-hard问题,因此更多情况下我们是使用L1范数
L1:计算绝对值之和,用以产生稀疏性,因为它是L0范式的一个最优凸近似,容易优化求解
L2:计算平方和再开根号,L2范数更多是防止过拟合,并且让优化求解变得稳定很快速(这是因为加入了L2范式之后,满足了强凸)。
 
http://blog.csdn.net/zouxy09/article/details/24971995
posted @ 2018-01-01 21:40  Key_Ky  阅读(926)  评论(0编辑  收藏  举报