原始问题对偶化
本篇假设已经了解Lagrange函数,对偶的基本原理,针对的问题是对没有约束的函数
问题
一般的统计机器学习目标函数可以通常为
其中
现在要对这个问题做对偶,为什么要做对偶在参考资料里也给出了几种情况,这里罗列如下:
- 参数
的维度小于数据维度,求解方便 - 可以分布式
公式
来制造约束。引入约束后,更新如下
这样就可以构造Lagrange函数,
利用共轭函数,上式整理为
最后的目标是要极大化Lagrange函数,即公式
根据
对于参考资料[1]中共轭函数的例子,
对Hinge和Square loss给出具体的推到
-
Hinge loss
分析
的取值情况(需要注意这时候的 ),当 时,即 时,上式变成 而且此时 还是一个无界的,因此极限不存在。当 时,即 时,上式变为 ,此时为了取极大值 ,因此变成 ,因为 的取值范围,最后变成 ,注意 ,因此最终的结果是 ,这个和图片中的结果有点不符,我也不太确信。 -
Square loss
对于Square loss直接展开,然后求极值就可以得到
的结果。
例子
例子来源于[2],primal问题是
根据公式
上式中的花括号的地方添加的
从而(3)到(4)的变换使用的就是square loss的共轭函数,为了简便,可以令
关于
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
2018-04-26 coursera—吴恩达Machine Learning笔记(1-3周)