2023-07-06 《数值优化方法》-庞丽萍,肖现涛-无约束最优化(一).md
2023-07-06 《数值优化方法》-庞丽萍,肖现涛-无约束最优化(一)
形如
的问题称为无约束最优化问题,注意到上述问题是定义在上且为实值函数。
对于上述优化问题首先需要明确的是最优解的概念。
定义 1.1 若对任意,不等式
成立,则称是优化问题的全局极小解(或全局最优解)。进一步地,若对任意的,不等式严格成立,则称为优化问题的严格全局极小解(或严格全局最优解)。
相应的可以定义局部最优解的概念。
若存在实数,以及的领域, 使得对任意, 不等式
成立,则称为为优化问题的局部极小解 (或局部最优解). 当不等式严格成立的时候,则称为严格局部极小解 (或严格局部最优解).
下面给出多元函数的二阶泰勒展开公式
其中为在处的梯度向量,为在处的黑塞 (Hesse) 矩阵.
下面的一些凸优化的基本概念在泛函分析和非线性最优化基础中都有详细的介绍。
定义 1.2 设是的子集,若对任意和任意, 有
则称为凸集。
注意该定义中,而在大部分的教材(凸优化 boyd)中,该定义为. 此外, 当时,称是仿射的.
定义 1.3 设是凸集, , 若对任意的和任意的, 不等式
成立,则称是上的凸函数,当且不等号严格成立的时候,称为是上的严格凸函数.
同样的,一般的定义中. 严格凸函数的定义为当及. 《非线性最优化基础》(林贵华), 《凸优化》(Boyd)
定理 1.1 (凸函数判别定理) 若, 则下面三个结论是等价的:
(1) 是凸函数;
(2) ;
(3) 是半正定的,记作.
这里简单总结证明思路
(1) (2) 只需要带入凸函数定义并转成形式, 然后两边取极限.
(2) (3) 对进行二阶泰勒展开然后取可得到.
(3) (1) 令, 然后对其二阶泰勒展开得到
然后整理可得。
定理 1.2 设,则有
(1) 若对任意, 是正定的,则是严格凸函数;
(2) 若是严格凸函数,则是半正定的。
下面讨论凸函数的最优解的性质。
定义 1.4 设, , , 且. 若存在, 使得
则称向量是在处的下降方向。
定理 1.3 (必要条件) 设在处可微,若为无约束优化问题的局部最优解,则.
证明:由一阶泰勒展开式立即可得。
定理 1.4 (充分条件) 设在处二阶可微,若, 为正定矩阵,则为无约束优化问题的严格局部最优解。
证明:在附近做二阶泰勒展开可得。
定理 1.5 (充要条件) 设函数是可微凸函数,则是无约束优化问题的全局最优解的充要条件是, 即是稳定点。
证明:由定理 1.3 和定理 1.1 可得。(只需注意到凸函数的局部最优解同时也是全局最优解,这里只需要带入凸函数定义即可)
下面给出迭代法的基本概念和收敛速度的定义。
下降迭代法产生的新的迭代点的目标函数值比前一个迭代点的目标函数值小。(我们知道很多迭代法并不满足这个性质,但是依然收敛)
下降算法的基本框架:
Step 1. (初始化) 选取初始点, 给出算法参数和计算精度,置.
Step 2. (确定搜索方向) 选取一个搜索方向, 使目标函数下降或至少不增..
Step 3. (线搜索)确定步长, 其满足, 令.
Step 4. (停止准则)给出算法的终止条件,若新的迭代点满足停止条件,则输出当前迭代解.
Step 5. (循环) 否则,并回到Step 2.
定义 1.5 若从任意的初始点出发,都能保证算法产生的点列(或子列)收敛到最优点,则称算法具有全局收敛性。若算法只有在初始点和最优点具有某种程度的接近时,才能保证算法产生的迭代点列的收敛性,则称该算法具有局部收敛性。
*注意子列收敛也是一种全局收敛性。
定义 1.6 设由算法产生的迭代点列收敛于, 即有
若存在实数及一个与迭代点次数无关的常数, 使
则称算法产生的迭代点列具有阶收敛速度。几种特殊情况
a. 若, , 则称算法是线性收敛的。
b. 若或时,则称算法是超线性收敛的.
c. 若, 则称算法是二阶收敛的.
定理 1.6 若点列超线性收敛于,则
证明:带入超线性收敛的定义并进行不等式缩放即可。
当算法是超线性收敛时,可以用作为终止条件。