Hesse矩阵和Jacobi矩阵
注意Hesse矩阵计算过程中目标变量是一元实值,自变量是向量,经过一阶导后变成目标变量为函数矩阵,自变量为向量函数,然后函数矩阵对向量求导,见书上定义 1.3.2
∇2f(x)=⎛⎜
⎜
⎜
⎜⎝∂2f(x)∂x21∂2f(x)∂x1∂x2......∂2f(x)∂xn∂x1∂2f(x)∂xn∂x2...∂2f(x)∂xn∂xn⎞⎟
⎟
⎟
⎟⎠
Jacobi矩阵计算过程中目标变量本身就是函数矩阵,自变量是向量,见书上定义 1.3.3
F(x)=(f1(x),f2(x),...,fm(x))T,x=(x1,x2,...,xn)T
F′(x)=⎛⎜
⎜
⎜⎝∂f1(x)∂x1∂f1(x)∂x2...∂f1(x)∂xn...∂fm(x)∂x1∂fm(x)∂x2...∂fm(x)∂xn⎞⎟
⎟
⎟⎠
1.凸集
凸集的定义
设集合D⊂Rn,如果对任意的x,y∈D,与任意的α∈[0,1],有
αx+(1−α)y∈D
那么称集合D是凸集
简单说凸集就是:若两个点属于此集合,则这两个点连线上的任意一点均属于此集合
凸集的性质
设D1,D2⊂Rn是凸集,α∈R,则
- D1∩D2={x|x∈D1,x∈D2}是凸集
- αD1={αx|x∈D1}是凸集
- D1+D2={x+y|x∈D1,y∈D2}是凸集
- D1−D2={x−y|x∈D1,y∈D2}是凸集
凸集的判定
- 充要条件:对任意m≥2,任给x1,...,xm∈D和实数α1,...,αm,且αi≥0,i=1,2...,m,m∑i=1α=1,均有
α1x1+...+αmxm∈D
2.凸函数
凸函数的定义
设D是非空凸集,f是定义在D上的函数,如果对任意的x1,x2∈D,α∈(0,1),均有
f(αx1+(1−α)x2)≤αf(x1)+(1−α)f(x2)
则称f为D上的凸函数
简单说就是线性组合的函数值≤函数值的线性组合
凸函数的性质
- f(x)=cTx(线性函数是凸函数)
- f(x)=||x||,范数是凸函数
- f(x)=xTAx,A对称正定,是凸函数
凸函数的判定
- f(x)是凸函数的充要条件是对任意额x,y∈Rn,一元函数ϕ(α)=f(x+αy)是关于α的凸函数
- D非空开凸集,f(x)在D上一阶连续可微,则f(x)在D上为凸函数的充要条件是
f(y)≥f(x)+∇f(x)T(y−x),∀x,y∈D
- 设D非空开凸集,f(x)在D上二阶连续可微,则f(x)是凸函数的充要条件是:f(x)的Hesse矩阵∇2f(x)在D上是半正定的
3.无约束最优化方法
普通函数局部解判断条件
一阶必要条件
设f(x)一阶连续可微,x∗是一个局部最优解,则⇒
∇f(x∗)=0
二阶必要条件
设f(x)二阶连续可微,x∗是一个局部最优解,则⇒
∇f(x∗)=0,且∇2f(x∗)为半正定
二阶充分条件
设f(x)二阶连续可微,且
∇f(x∗)=0,∇2f(x∗)为正定
⇒x∗是无约束问题的一个严格局部最优解
凸函数最优解的判断条件
充要条件
f为凸函数,f(x)一阶连续可微,则x∗是全局最优解的充要条件是
∇f(x∗)=0
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)