正则化L1 和L2 和Elastic Net(待更)
一、什么是正则化
英文 Ragularization
使模型普通化、均匀化、一般化,防止或减小 模型的过拟合。
二、正则化项(惩罚项)
英文 Ragularizer(Penalty)
经验风险 -- 经验指模型的预测值和数据真实值的相近程度
结构风险 -- 结构指模型,当数据量偏少时,复杂结构的模型存在过拟合风险
三、具体内容
正则化项可以是模型参数的范数,这里只介绍一范数的L1 和二范数的L2。
1、L1 -- Lasso
一范数L1,实际是模型参数的绝对值,然后求和:
其中
以2 维为例,模型参数为
蓝色 -- 损失函数,中心最小
黄色 -- L1,红线内为允许范围
多数情况下,黄色区域的顶点处,取到最优解
2、L2 -- Ridge
二范数L2,实际是模型参数的平方,然后求和:
以2 维为例,模型参数为
黄色区域的边缘处,均有可能取到最优解
3、L1 + L2 -- Elastic Net
Paper ← 论文链接
(1)原始Elastic Net
公式(3)是损失函数。
公式(4)是最优解。
公式(5)是公式(3)的构建过程:原最小二乘 + 约束项
我们称 约束项 为 elastic net penalty。
(2)Elasitc Net(待更)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构