奇异值分解(SVD)

0 - 特征值分解(EVD)

奇异值分解之前需要用到特征值分解,回顾一下特征值分解。

假设$A_{m \times m}$是一个是对称矩阵($A=A^T$),则可以被分解为如下形式,

$$A_{m\times m}=Q_{m\times m}\Sigma_{m\times m} Q_{m\times m}^T=Q_{m\times m}\begin{bmatrix}\lambda_1 & 0 & 0 & 0 \\ 0 & \lambda_2 & 0 & 0 \\ 0 & 0 & \ddots & 0 \\0 & 0 & 0 & \lambda_m \end{bmatrix}Q_{m\times m}^T,$$

其中$Q_{m\times m}$为标准正交矩阵,即$Q_{m\times m}Q_{m\times m}^T=I_{m\times m}$,$\Sigma_{m\times m}$为对角矩阵,$\lambda_i$为特征值。

注意到,特征值分解要求被分解的矩阵必须是实对称矩阵!

1 - 奇异值分解(SVD)

由于现实遇到的问题中的矩阵很难保证是实对称矩阵,奇异值分解便可以处理更加广泛的矩阵。

1.0 - 定义

对于实数矩阵$A_{m\times n}$,可以将其分解为如下形式,

$$A_{m\times n}=U_{m\times m}\Sigma_{m\times n} V_{n\times n}^T=U_{m\times m}\begin{bmatrix}\sigma_1 & 0 & 0 & 0 \\ 0 & \sigma_2 & 0 & 0 \\ 0 & 0 & \ddots & 0 \\ 0 & 0 & 0 & \ddots \end{bmatrix}_{m\times n}V_{n\times n}^T,$$

其中$U_{m\times m}$和$V_{n\times n}$分别为左奇异矩阵和右奇异矩阵,且均为标准正交矩阵($U_{m\times m}U_{m\times m}^T=I_{m\times m}$和$V_{n\times n}V_{n\times n}^T=I_{n\times n}$),$\sigma_i$称为奇异值,$Q$(特征矩阵)中的每一列$q_i$为$\sigma_i$对应的特征向量。

1.1 - 求解

注意到,有如下性质,

$$AA^T=U\Sigma V^TV\Sigma^T U^T\&=U\Sigma\Sigma^T U^T=U\begin{bmatrix}\sigma_1^2 & 0 & 0 & 0\\ 0 & \sigma_2^2 & 0 & 0\\ 0 & 0 & \ddots & 0\\ 0 & 0 & 0 & \ddots\end{bmatrix}_{m\times m}U^T,$$

$$A^TA=V\Sigma^T U^TU\Sigma V^T=V\Sigma^T\Sigma V^T=V\begin{bmatrix}\sigma_1^2 & 0 & 0 & 0\\ 0 & \sigma_2^2 & 0 & 0\\ 0 & 0 & \ddots & 0\\ 0 & 0 & 0 & \ddots\end{bmatrix}_{n\times n}V^T,$$

其中,$AA^T$和$A^TA$均为实对称矩阵,由上述两式可得,$\Sigma\Sigma^T$和$\Sigma^T\Sigma$分别为$AA^T$和$A^TA$经过矩阵分解之后的特征值矩阵,因此对特征值矩阵开方即可得到奇异值矩阵。

1.2 - 实践

SVD的奇异值表示了分解对象中的重要特征,因此可以通过取分解之后的部分特征来重构图像。对于一张图分别选前10、50、100、200、300重要的奇异值之后再重构图像可视化效果如下。

 

 2 - 代码

特征值分解(EVD)和奇异值分解(SVD)以及实践的python代码可见于我的github

3 - 参考资料

https://www.cnblogs.com/endlesscoding/p/10033527.html

https://github.com/Chet1996/Notebooks/tree/master/SVD

posted @ 2019-10-20 14:57  CZiFan  阅读(1154)  评论(2编辑  收藏  举报