眩しさだけは、忘れなかった。|

【最优化方法】第一次要点整理

多元函数的可微性和展开

多元单值函数:f(x)=f(x1,x2,...,xn),其中 x=(x1,x2,...,xn)T

梯度:xf(x)=(fx1,fx2,...,fxn)T

黑塞矩阵:

H=x2f(x)=[2fx122fx1x22fx1xn2fxnx12fxnx22fxn2]

雅可比矩阵:J=x2f(x)T(将黑塞矩阵转置即可得到)

注意:当后文出现形如 xRn 时,说明 x 为向量。后文不再使用箭头形式。

xRn,多元函数的一阶泰勒展开(矩阵形式):

f(x)=f(x)+f(x)T(xx)+o(||xx||)

xRn,多元函数的二阶泰勒展开(矩阵形式):

f(x)=f(x)+f(x)T(xx)+12(xx)T2f(x)(xx)+o(||xx||2)

关于上两式的推导,在《高等数学》中均有提及。

xRn,在微分多元函数时经常使用以下规则:

  • ARm×n,有 xAx=A
  • ARn×m,有 xxA=A
  • ARn×n,有 xxAx=(A+A)x
  • xx2=xxx=2x
  • 对于任意矩阵 X,有 XXF2=2X

p-范数

定义:设 xRn||x||p=(i=1nxi)1p

p-范数 公式 二维范数的图像
0-范数 非零元的个数 -
1-范数 ||x||1=i=1n|xi| |x|+|y|=1(菱形)
2-范数 ||x||2=i=1n|xi|2=xTx x2+y2=1(圆形)
∞-范数 ||x||=limp(i=1n|xi|)1p=max1in|xi| max(|x|,|y|)=1(正方形)

凸函数

凸函数定义:对 x,yDλ(0,1),有:

f(λx+(1λ)y)λf(x)+(1λ)f(y)

强凸函数定义:对 x,yDλ(0,1),有:

f(λx+(1λ)y)λf(x)+(1λ)f(y)r2λ(1λ)||xy||2

其中 r 为强凸系数。

摘自《Strong-Convexity:强凸性》:这个强凸的性质是很重要的。直观从一维函数来说,一般凸函数只要求函数曲线在其切线之上,至于“上”多少没有要求,也就意味着曲线可以无限“贴着”切线,只要保持在其上就行了。毫无疑问,在优化特别是梯度优化中,这种微弱的梯度变化很难实现快速优化,有可能在有限次数还达不到收敛。如果我们取一个接近最小值的解,这也很难。“非常”接近只是一个定性理解,在这种情况下会出现最优解很近似但是决策变量相差巨大的糟糕情况。这时候,多加一个二次项的,保证有一个二次下界,那么不会出现“贴着”切线的情况,优化也变得更加简单。

一些定理:

  • f(x) 是凸函数 f(x)f(x)+f(x)T(xx)
  • f(x) 是严格凸函数 f(x)>f(x)+f(x)T(xx)
  • f(x) 是一致凸函数 f(x)f(x)+f(x)T(xx)+r2||xx||2
  • f(x) 是凸函数 2f(x) 半正定(即 2f0,或 xHx0
  • f(x) 是严格凸函数 2f(x) 正定(即 2f0,或 xHx>0
  • f(x) 是一致凸函数 2f(x) 一致正定

凸集

11.2. 凸性 - 动手学深度学习2.0.0

无约束优化问题的最优解条件

最优解的定义

xRn,δ0,则:N(x,δ)=xRn,||xx||δ

xf(x) 的:

  • 全局极小值点(最小值点):xRn,xx,f(x)f(x)
  • 局部极小值点:δ>0,xN(x,δ),xx,f(x)f(x)
  • 驻点:f(x)=0
  • 鞍点:f(x)=0,且 δ>0y,zN(x,δ),有 f(y)>f(x)>f(z)

f(x) 为凸函数,则局部极小值点即为全局极小值点。

一阶最优解条件

【一阶最优解的必要条件】设 xDf(x) 的一个局部极小值点,则 f(x)=0

证明:对于 dRn,不妨设 ||d||=1δ>00<α<δ,泰勒展开得:

f(x)f(x+αd)=f(x)+αf(x)Td+o(||αd||)

整理得:

f(x)Td+o(||αd||)α0

α0+,则:

f(x)Td0

d=f(x),则有:||f(x)||0,所以:f(x)=0

【一阶最优解的充要条件】设 f(x) 为凸函数,则:xf(x) 的全局极小值点 f(x)=0

二阶最优解条件

【二阶最优解的必要条件】设 xDf(x) 的一个局部极小值点,则 f(x)=0,且 2f(x) 半正定。

证明:对于 dRn,不妨设 ||d||=1δ>00<α<δ,泰勒展开得:

f(x)f(x+αd)=f(x)+αf(x)Td+12α2dT2f(x)d+o(||αd||2)=f(x)+12α2dT2f(x)d+o(||αd||2)

整理得:

12dT2f(x)d+o(||αd||2)α20

α0+,则:

dT2f(x)d0

所以 2f(x) 半正定。

【二阶最优解的充分条件】若 f(x)=0,则:

  • 2f(x) 正定,则 xf(x) 的局部极小值点
  • 2f(x) 负定,则 xf(x) 的局部极大值点
  • 2f(x) 不定,则 xf(x) 的鞍点(不是极值点)
  • 2f(x) 半正定,则上述三种情况都有可能

可对照《高等数学》中二元函数求极值的充分条件。

本文作者:漫舞八月(Mount256)

本文链接:https://www.cnblogs.com/Mount256/p/18471335

版权声明:本作品采用CC 4.0 BY-SA许可协议进行许可。

posted @   漫舞八月(Mount256)  阅读(57)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
历史上的今天:
2022-10-17 考研英语不熟悉的词义(List6-List10)
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
展开
  1. 1 Main Menu Theme Syd Matters
  2. 2 Luminous Memory (Acyanxi Remix) Acyanxi
  3. 3 夏影 麻枝准
  4. 4 潮騒の香り 水月陵
  5. 5 stand still 井口裕香 (いぐち ゆか)
  6. 6 流星雨 麻枝准
  7. 7 Summer Fantasy 傅许
  8. 8 失う 米白
  9. 9 epilogue 霜月はるか
  10. 10 夏に君を待ちながら 小原好美
  11. 11 桜のような恋でした 鹿乃 (かの)
  12. 12 風は微かに、熱を残し… 水月陵
  13. 13 夏凪ぎ 麻枝准/やなぎなぎ
  14. 14 空に光る 戸越まごめ
  15. 15 木漏れ日 riya
  16. 16 Songbirds Homecomings (ホームカミングス)
  17. 17 宝物になった日 麻枝准/やなぎなぎ
  18. 18 夏影~あの飛行機雲を超えた、その先へ~ 雪桜草 (雪樱草)
  19. 19 快晴 Orangestar (蜜柑星P),初音未来 (初音ミク)
  20. 20 永遠 霜月はるか
  21. 21 Sion 天門
  22. 22 遙かな年月-piano- 麻枝准
  23. 23 夏恋慕 kobasolo/春茶
  24. 24 夏凪ぎ-piano ver.- MANYO/麻枝准
  25. 25 Goodbye Seven Seas -piano ver.- MANYO/麻枝准
  26. 26 Light Years 麻枝准/やなぎなぎ
  27. 27 優しさの記憶 鹿乃 (かの)
夏影 - 麻枝准
00:00 / 00:00
An audio error has occurred, player will skip forward in 2 seconds.