优化整理
函数 的一些性质
-
Lipschitz continuity
-
Smoothness
-
Strong convexity
Smoothness函数的性质
光滑凸函数的性质
-
如果
是二阶可微的,则 -
二阶上界
可以直接通过上述的
导出 -
下界
令
, 为凸函数且在 取得最小值, ,将进行泰勒展开可以得到结果。 -
co-coercivity
-
到最优点的距离
-
如果
是 强凸的,那么同样,令
并利用强凸的定义即可。 -
如果
是 强凸,那么到最优点的距离
光滑函数梯度下降
令光滑函数梯度下降的迭代过程为
-
如果
是 强凸的,那么即,梯度下降算法是
线性收敛的。最后使用
-
如果
仅仅是 的,那么将
的迭代过程带入,并利用利用凸函数的性质和柯西施瓦茨不等式可以得到
同时利用上一步的结果
定义
倒数第二步骤,从
的加和,两边都是加上前一步结果后,左式的 被消除,因此就等于最后的结果。
加速梯度下降
对于
则会有
如果
则会有
文章说的ten-line proof并没看懂...
Proximal gradient descent
Proximal gradient descent
针对的是
其中Lipschitz
连续,
其要找到一个
推导过程为,假设除去
对其在
最后一个等式去除了一些无关的常数项,因此最后一行其实是原式子的上界,通过对其上界进行优化从而实现其下降。
求解过程如下
加入没有
继而可以得到
因为
,上式对 求导即可得到结果
这个结果进一步说明了Proximal Gradient Descent
与通常的梯度下降间的联系。
令
证明: 将
代入 得到
参考文献
- Francis Batch, Statistical machine learning and convex optimization
- [Ryan Tibshirani, Convex Optimization](
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异