数值优化（Numerical Optimization）学习系列-无梯度优化（Derivative-Free Optimization）

2015年12月27日 18:51:19 下一步阅读数 4357更多

本文链接：https://blog.csdn.net/fangqingan_java/article/details/48946903

概述

在实际应用中，有些目标函数的梯度不容易计算，即使使用有限差分等近似算法，也会因为噪声的存在导致结果不精确。无梯度优化算法（DFO-Derivative-Free Optimization）可以在不计算梯度的情况下进行问题的最优化，主要有两类思路，一是根据目标函数的样本进行拟合，对拟合函数进行最优化；二是用一些启发式算法。
1. 有限差分和误差
2. 基于模型近似的方法
3. 坐标和模式搜索方法
4. 其他DFO方法
5. 总结

有限差分和误差

有限差分方法在某些情况下可能会有一定的误差，例如如果函数值需要通过随机试验进行模拟，此时会引入人为误差或者仪器误差。
因此对问题进行建模时，将误差引入目标函数中，然后利用有限差分和梯度相关算法进行优化。

f (x) = h (x) + ϕ (x)

其中函数h表示某平滑函数，

ϕ

对误差进行建模后，然后利用中心有限差分方法，进行梯度的计算

\partial f \partial x i \approx f ( x + ϵ e i ) - f ( x - ϵ e i ) 2 ϵ

噪声水平（Noise Level）定义为：
在x附近噪声最大值。 $η (x; ϕ) = s u p_{| | z - x | | \leq ϵ} | ϕ (z) |$

此时使用有限差分方法，近似误差来源于固有误差和噪声误差。

基于模型的方法

主要思路是，在第k步迭代时，基于该点进行模型近似，通过采样推导出模型中的参数，基于该模型进行最优化计算。

二次模型近似

在第k步迭代时，构建一个二次模型进行近似

m k (x k + p) = c + g T p + 1 2 p T G p

ϕ

在实际应用中，我们仅需要更新模型M即可，不用每次都重新计算。可以选择合适方便计算的基函数。

算法过程如下

算法过程如下
1. 构建插值集合 $Y = y^{1}, y^{2} . . . y^{q}$

二次模型的缺点：样本点选择是O(n^2)的，如果维度越高计算复杂度越大。因此可以考虑线性模型，此时只有O(n+1)个样本需要求解，复杂度会降低。

坐标和模式搜索方法

不同于梯度相关的算法，基于模式搜索方法的搜索方向都是事先确定好的，该方法需要从方向集合中选择一个下降方向作为搜索方向并且更新该方向集合，之后利用线搜索决定步长，逐步迭代得到最优解。
坐标下降是模式搜索方法中的一个特例。

坐标搜索方法（Coordinate SearchMethod）

该方法也称之为坐标下降法或者变量交替方法，主要思路是依次沿着坐标轴方向进行线搜索。
详细过程如下
1. 选择某个迭代点x=(x1,x2…xn)，固定x2…xn，优化x1使得目标函数最小
2. i=2..n 优化x_i使得目标函数最小
3. 重复以上步骤
对于二维情况下，搜索过程如下

从上图中可以看出，对于条件数比较大的问题，收敛速度非常低。

实际中，如果沿着线性独立的搜索方向搜索，可能不能保证收敛。但是优点是不需要计算梯度，并且对于变量松耦合的情况下，收敛速度可以接受。

另外为了进行优化，搜索方向可以选择为{ $e_{1}, e_{2} . . . e_{n}, e_{n - 1} . . . e_{1}$

模式搜索方法

每次搜索方向都是从一个“结构集”中选取，找到某个下降点，进行线搜索，否则修改步长，重复该过程。
该方法会受到噪声点、函数值不精确、不平滑的影响。算法过程如下
算法描述如下
定义
* $D_{k}$

初始化搜索方向集合 $D_{0}$

有理论保证如果搜索方向满足一下条件，则一定能保证收敛。 $κ (D k) = min v \in R n max p \in D k v T p | | v |$ $β m i n \leq | | p | | \leq β m a x$

条件1说明需要保证最少有一个搜索方向和最优方向的夹角小于90，即cos( $θ$

条件2说明搜索方向的模不能相差太大，因此搜索步长统一进行缩放。

满足条件的搜索方向有 { $e_{1}, e_{2} . . . e_{n}, - e_{1} . . . - e_{n}$

递增函数可以选择为 $ρ (t) = M t^{3 / 2}$

其他DFO算法

共轭方向算法

类似于共轭梯度方法，该方法的目标是最优化

f (x) = 1 2 x T A x - b T x

ϕ

Parallel subspace property

通过该方法可以找到一系列共轭方向，并且沿着该方向可以得到最优解，以二维情况为例

如上图如果直线l1和l2平行，并且x1*和x2*是目标函数沿着该直线的最优解，则x1*-x2*共轭于直线的法向量。
因此只要沿着某两个平行子空间寻找最优解，则最优解的差就共轭于该平面的法向量。
假设{ $p_{1}, p_{2} . . . p_{l}$

s 1 = {x 1 + \sum i = 1.. l α i p i}

s 2 = {x 2 + \sum i = 1.. l α i p i}

ϕ

证明很简单
由于x1*是最优解，则有

\partial f ( x * 1 + α i p i ) \partial α i = \partial f ( x * 1 + α i p i ) p i

ϕ

0 = (\nabla f (x * 1) - \nabla f (x * 2)) p i = (A x 1 - b - A x 2 + b) p i = (x

ϕ

Nelder-Mead 方法

也叫做Nelder-Mead simplex reflection方法。
保存n+1个点，并且这些点构成一个单纯性，在每次循环中搜索使得函数值最低的点，去掉后，用其他更好的点替代。

Implicit Filtering方法

对比于带有噪声的有限微分方法，适用于noise level随着迭代减小的情形。

总结

通过该小结的学习，可以了解到
1. 对于梯度不可求的复杂函数，可以通过DFO的方式进行优化
2. 通过随机试验估计函数值的最优化问题，可以考虑带噪声的有限差分。
3. 了解基于模型的方法，但是复杂度可能会比较大
4. 了解坐标下降法和模式搜索算法
5. 了解基于共轭方向等其他方法。

posted on 2019-09-09 19:04 曹明阅读(2671) 评论(0) 收藏举报

数值优化（Numerical Optimization）学习系列-无梯度优化（Derivative-Free Optimization）

数值优化（Numerical Optimization）学习系列-无梯度优化（Derivative-Free Optimization）

概述

有限差分和误差

基于模型的方法

二次模型近似

坐标和模式搜索方法

坐标搜索方法（Coordinate SearchMethod）

模式搜索方法

其他DFO算法

共轭方向算法

Parallel subspace property

Nelder-Mead 方法

Implicit Filtering方法

总结

数值优化（Numerical Optimization）学习系列-惩罚和增广拉格朗日方法（Augmented Lagrangian Methods）

qpOASES：使用说明（翻译）

数值优化（Numerical Optimization）学习系列-目录

Derivative-Free and Blackbox Optimization

qpOASES库keil移植的问题

qpOASES: a parametric active-set algorithm for quadratic programming

如何解决labview循环结构中调用matlab节点后，程序运行缓慢的问题

神经网络控制学习笔记——神经网络背景1

数值优化（Numerical Optimization）学习系列-概述

数值优化（Numerical Optimization）学习系列-大规模无约束最优化（Large-Scale Unconstrained Optimization）

qpOASES：特殊QP类型的求解1（翻译）

kkwant

weixin_40709533

Seehidre

几种常见梯度优化方法

导数的理解

Apollo代码学习(六)—模型预测控制(MPC)

Matlab 不等式 线性方程式最优解

MPC求解（基于apollo代码的理解）

百度Apollo自动驾驶专题讲座笔记之运动规划模块

如何在服务器中保存OpenAI gym库中的视频

qpOASES使用笔记

python，matlab,C++ 凸优化库——anaconda spyder->cvxpy,matlab->cvx,C++->qpOASES

QP问题的解法（拉格朗日乘子法）

Python——使用scipy求解带约束的最优化问题

二次规划——学习笔记

Eigen学习

二次型求导

rqt_plot工具——ROS中查看变量时间趋势线

roscpp添加第三方依赖库——以QuadProg++为例

[最优化]不等式约束的优化问题求解

Installing qpOASES

no kernel image is available for execution on the device，计算能力不匹配的问题？

openssl移植到armBN_mod_inverse:no inverse

画图问题，怎样用R语言将多个图片连接在一个圆形上？如下图

KUKA KR-16串联6轴机器人D-H坐标系建立以及参数确定问题

道路的修建，一个最优化的规划问题的算法，怎么用C语言的代码来实现呢

Opencv里vector<Mat>的问题

库文件更新，工程本地需要更新库重新编译吗？

基于【Apollo】进程异常崩溃定位方法

ubuntu 16.04下安裝和配置ros（ORB-SLAM-A）

【Apollo】模拟运行

使用CVXPY遇到个问题，请教。。

数值优化（Numerical Optimization）学习系列-信赖域方法

数值优化（Numerical Optimization）学习

matlab学习optimization tools （solve中各方法的理解应用）

【优化算法】基于梯度的优化算法

有关梯度优化方法学习总结

基于梯度的优化方法

webpack4 optimization配置

3.webpack的optimization配置

机器学习，最优化数值计算常用算法

数值最优化方法

Matlab 不等式线性方程式最优解