[最优化方法笔记] 梯度下降法
1. 梯度下降法
无约束最优化问题一般可以概括为:
通过不断迭代到达最优点
其中
我们需要寻找可以不断使得
构造一元辅助函数:
其中
由一阶泰勒展开式将目标函数进行泰勒展开:
(带皮亚诺余项的一阶泰勒展开)
可得:
为了使得迭代过程 可行,能够达到 收敛,显然有
显然,为了能够使得
为了使得 下降速度尽可能快,即有关于下降方向的最优化问题:
由 柯西不等式:
根据柯西不等式等号成立的条件,需要使
由此得出 梯度下降法 (最速下降法) 的迭代格式:
其中 步长
终止条件 一般有
如下图所示,为一个二元二次函数

在机器学习领域,梯度下降法有非常广泛的应用。例如梯度下降法解决线性回归问题。[机器学习复习笔记] Grandient Descent 梯度下降法
2. Lipschitz 连续
2.1 梯度利普希茨连续定义
给定可微函数
则称
函数
2.2 下降引理(二次上界)
设可微函数
其中
导数
对函数
对任意
3. 梯度下降收敛性
梯度法迭代式:
-
设函数
为凸函数,且梯度利普希茨连续 -
极小值
存在且可达 -
步长应满足
条件(2)是一个不可或缺的条件,它保证了原始的优化问题存在可行解。
条件(1)和条件(3)使得下降引理成立,保证了梯度下降算法在优化目标函数过程中的正确性。
参考
刘浩洋, 户将, 李勇锋, 文再文《最优化:建模、算法与理论》
一切都是命运石之门的选择,本文章来源于博客园,作者:MarisaMagic,出处:https://www.cnblogs.com/MarisaMagic/p/17903765.html,未经允许严禁转载
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix