深入分析:Lasso问题和原子范数问题研究
写在前面
本文将主要围绕Lasso问题和原子范数等经典问题进行对偶问题的推导、分析,由于笔者的数理基础浅薄,下面的证明过程若存在错误,欢迎评论指正。
LASSO问题
推导
问题定义:
问题推导:
0、上述问题是典型的无约束问题,可以通过变量替换的思想进行处理。
1、令,上述问题更新为.
2、可以观察到中关于和的元素项不存在耦合关系,因此可进步将问题拆解为独立的最小项和,其中,
3、,这个最小项可以表征为示性函数形式,示性函数.
4、对求极值,可以得到,即.
5、将上述约束代入,可以得到下式:
那么对偶问题可以表示为如下形式:
原子范数对偶问题
推导
有噪声情况下,原子范数的原问题可以抽象为:
对偶函数可以写为在上的下确界,即
下面对原问题的对偶问题进行推导:
1、原问题的增广拉格朗日目标函数可以表示为:
将拉格朗日方程进行重写,
2、下确界的求解是关于的最小化,因此对原拉格朗日增广函数的最小化可以转换为对求下确界。在求这项下确界时,需要对式中的噪声功率参数和对偶变量求偏导寻找极值点。
当对噪声功率参数求偏导时[目的是为了使噪声功率最小化],有,可以得到最佳极值点,此时对应的对偶函数为
当对对偶变量求偏导时,有,可以得到最佳极值点.
最后,基于最优极值点对偶函数可以表示为.
对于下确界项,对每个,有,表示和间的角度,基于此可以得到以下结论:
当时下确界项为0;当时下确界可以达到。
3、整理上述讨论,有噪声下的原子范数的对偶问题可以表征为:
在上式中,中表示逆FFT算子,对偶多项式可以表示为,其中.
4、为了进一步抽象,我们可以作以下表示:
令为次的三角多项式向量,那么因果三角多项式可以表征为:,其中表示多项式系数向量.
对于非负三角多项式,可以有Hermitian矩阵,其中,并且,稀疏可以通过自相关矩阵的第条对角线元素进行计算.
令两个多项式和满足以下不等关系:
这意味着,定义和,那么有,即,其中和为自相关向量和的自相关矩阵.
根据Schur补条件有,即
令多项式的振幅均匀有界(对所有有,其中为给定正实数.作为有界三角多项式的特例,令,那么可以用两个线性不等式抽象,如下:(其中)
有界三角多项式的结果可以用于范数,因为多项式的最大振幅设置上界意味着多项式对所有具有一致有界的振幅,即
回到本节开始处,基于振幅一致有界条件和Schur补条件,对偶问题可以表征为以下凸优化问题:
代码
% 本处仅给出上述凸优化问题的核心代码 if noise_flag == 0 % 无噪声版本 cvx_begin sdp quiet cvx_solver sdpt3 variable S(M+1,M+1) hermitian subject to S >= 0; S(M+1,M+1) == 1; trace(S) == 2; % 主对角元素迹为2 for j = 1 : M-1 sum(diag(S,j)) == S(M+1-j,M+1); % 非主对角线元素求和为0. end maximize (real(S(1:M,M+1)'* Y)) % - 0.5 * norm(c) cvx_end else % noise version regular_param = 0.2; % 有噪声需要引入正则化参数 cvx_begin sdp quiet cvx_solver sdpt3 variable S(M+1,M+1) hermitian subject to S >= 0; S(M+1,M+1) == 1; trace(S) == 2; for j = 1 : M - 1 sum(diag(S,j)) == S(M+1-j,M+1); end maximize (real(S(1:M,M+1)'* Y) - regular_param * norm(c)); cvx_end end
原子范数软阈值问题的推导
推导
原子集合由各个正弦曲线的样本组成,,表示为
无限原子集组成了适当的原子集合,在对偶问题中可以写成一个稀疏的非负的原子组合。,.
相应的对偶范数采用直观的形式:,可以理解为在单位圆上获得的最大绝对值,为与线谱原子集相关的原子范数的半正定规划.
根据上式可知向量的对偶原子范数是复数三角多项式的最大绝对值;因此,对对偶原子范数的约束等价于对大小的限制:.函数是一个三角多项式,非负的充要条件是可以写成三角多项式的平方和.
定义映射,从输入创建一个Hermitian Toeplitz 矩阵,即.
对于给定的因果三角多项式如果有且仅有复Hermitian矩阵存在时有,这与原子范数对偶问题中第4节证明类似,即有其中,表示的Hermitian转置.
重写原子范数为下列形式:
下面对上述问题进行对偶推导:
1、首先需要将上述问题转化为无约束的拉格朗日方程形式,可以表示如下:
2、关于的项为$\langle x,v\rangle-\langle\Gamma, \rangle v$求解极值,则有
,那么可以得到
3、关于的项为,对变量求解极值前,先将进步抽象为,那么关于的偏导可表示为,那么则有,其中,用于半正定约束.
4、将结果代入到中,那么有如下证明:
.
根据半正定约束条件,通过对和缩放则有
这等价于将对应目标函数缩放为,那么原问题的对偶形式可以表示如下:
那么对应有噪声版本下的原问题对偶函数可以表示如下:[表示正则参数]
上述问题可以通过凸优化中的SDP解释器求解,但是计算复杂度较高,可以通过交替方向投影算子加速求解,这将在后续的章节进一步讨论。
代码
% 在上述推导过程中讨论了单快拍下有噪声和无噪声版本的原子范数模型 % 在本代码中笔者给出了单快拍和多快拍版本,后续将补充多快拍版本的理论 if noise_flag == 0 % 无噪声情况下的原子范数AST模型 if snap == 1 % 单快拍模型 cvx_begin sdp quiet cvx_solver sdpt3 variable T(M, M) hermitian toeplitz variable x minimize (0.5 * x + 0.5 * T(1,1)) [x Y'; Y T] >= 0; cvx_end [Phi, Val] = rootmusic(T, P, 'corr'); Phis = Phi / 2 / pi ; estimated_theta = asind(-Phis * lambda / d); else % 多快拍模型 cvx_begin sdp quiet cvx_solver sdpt3 variable T(M, M) hermitian toeplitz variable X(snap, snap) hermitian minimize (trace(X)+trace(T)) [X Y'; Y T] >= 0; cvx_end [Phi, Val] = rootmusic(T, P, 'corr'); Phis = Phi / 2 / pi ; estimated_theta = asind(-Phis * lambda / d); end else % 有噪声情况下的原子范数AST模型 if snap == 1 % 单快拍模型 sigma = 1; regular_param = sqrt(M * log(M * sigma)); cvx_begin sdp quiet cvx_solver sdpt3 variable T(M, M) hermitian toeplitz variable x variable z(M,1) complex minimize (regular_param * 0.5 *(x + T(1,1)) + 0.5 * norm(Y-z)) [x Y'; Y T] >= 0; cvx_end [Phi, Val] = rootmusic(T, P, 'corr'); Phis = Phi / 2 / pi ; estimated_theta = asind(-Phis * lambda / d); else % 多快拍模型 regular_param = sqrt(M * (snap + log(M) + sqrt(2 * snap * log(M)))); cvx_begin sdp quiet cvx_solver sdpt3 variable T(M,M) hermitian toeplitz variable X(snap, snap) hermitian variable Z(M, snap) complex minimize (regular_param * (trace(X) + trace(T)) + 1 / 2 * sum_square_abs(vec(Y - Z))); [X Y';Y T] >= 0; cvx_end [Phi, Val] = rootmusic(T, P, 'corr'); Phis = Phi / 2 / pi ; estimated_theta = asind(-Phis * lambda / d); end end
参考文献
[1] Atomic norm denoising with applications to line spectral estimation. https://arxiv.org/abs/1204.0562
[2] Grid-free compressive beamforming. https://arxiv.org/abs/1504.01662
[3] Positive Trigonometric Polynomials and Signal Processing Applications.
[4] Regularized Matrix Factorization for Multilabel Learning With Missing Labels. https://ieeexplore.ieee.org/abstract/document/9198894
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 提示词工程——AI应用必不可少的技术
· 地球OL攻略 —— 某应届生求职总结
· 字符编码:从基础到乱码解决
· SpringCloud带你走进微服务的世界