正则化L1 和L2 和Elastic Net(待更)

一、什么是正则化

  英文 Ragularization

  使模型普通化、均匀化、一般化,防止或减小 模型的过拟合。

二、正则化项(惩罚项)

  英文 Ragularizer(Penalty)

  经验风险 -- 经验指模型的预测值和数据真实值的相近程度

  结构风险 -- 结构指模型,当数据量偏少时,复杂结构的模型存在过拟合风险

三、具体内容

  正则化项可以是模型参数的范数,这里只介绍一范数的L1 和二范数的L2。

  1、L1 -- Lasso

    一范数L1,实际是模型参数的绝对值,然后求和:

      i|wi|

    其中 wi 是模型的参数。

    以2 维为例,模型参数为w1w2

    蓝色 -- 损失函数,中心最小

    黄色 -- L1,红线内为允许范围

    多数情况下,黄色区域的顶点处,取到最优解w。而顶点都是在轴上的,代表有的模型参数为0,所以L1 可以进行特征选择。

  2、L2 -- Ridge

    二范数L2,实际是模型参数的平方,然后求和:

      iwi2

    以2 维为例,模型参数为w1w2

    黄色区域的边缘处,均有可能取到最优解w。最优解不被限制在轴上,模型参数都可取到值,所以L2 可以分散特征,同时表现特征的重要程度。 

  3、L1 + L2 -- Elastic Net

    Paper ← 论文链接

    (1)原始Elastic Net

      公式(3)是损失函数。

      公式(4)是最优解。

      公式(5)是公式(3)的构建过程:原最小二乘 + 约束项

       我们称 约束项 为 elastic net penalty。

       α就是调节Lasso 和Ridge 的两者占比程度。

    (2)Elasitc Net(待更)

       

 

 

  

  

posted @   paramotor  阅读(78)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
点击右上角即可分享
微信分享提示