矩阵分解与矩阵求导
基础
- 向量运算:(模长
)- 内积(inner product,数量积,点乘):
(投影) - 外积(exterior product,向量积,叉乘):
(右手定则) - 外积(outer product):
- 内积(inner product,数量积,点乘):
- 矩阵运算:(
)- 乘积:
- 左乘变行
- 右乘变列
- 左乘变行
- Hadamard 积(逐分量积,Schur 积):
- 内积(inner product,数量积,点乘):
- Kronecker 积(直积,圈乘):
- 设
的特征值和特征向量分别为 , 的特征值和特征向量分别为 ,那么 的特征值为 ,特征向量为 ( )。
- 向量化(vectorization,列堆栈):
- 乘积:
- 范数:非负性,绝对(模)齐次性,次可加性(三角不等式);
- 复数模的推广,
- 有限维赋范线性空间范数等价(诱导相同的拓扑)
- 向量范数
:( ) 时为范数 (曼哈顿距离) (欧氏距离) (切比雪夫距离 )
- 矩阵范数
:(相容性/次可乘性: )- 逐元素(entrywise)范数
(列堆栈后向量范数) 范数- F 范数
范数 (其 倍相容)
- 算子(operator)范数
(由向量范数诱导的从属范数,作为线性变换作用到单位向量上的最大拉伸倍数)- 最大绝对列和范数
- 谱范数(2 范数)
- 最大绝对行和范数
- 最大绝对列和范数
- Schatten 范数
(由矩阵奇异值定义的范数,酉不变)- 核范数
(矩阵秩的凸包络,即最佳凸逼近 / 凸松弛) 范数 (自对偶) 范数 (与核范数互为对偶范数)
- 核范数
- 逐元素(entrywise)范数
- 矩阵范数不等式:
- 复数模的推广,
- 矩阵
的性能指标- 二次型
(半)正定性- 每个二次型对应唯一的 Hermite 矩阵以及该矩阵的合同等价类
- 行列式
奇异性- 行列式是矩阵行(列)向量组构成的平行多面体的有向体积,是矩阵作为线性变换对有向体积拉伸倍数
- 余子式
,代数余子式 - 矩阵行列式等于其任意行(列)的元素与相对应的代数余子式乘积之和
- 迹
- 秩
(非零特征值的代数重数)
- 二次型
- 矩阵
的等价关系- 相抵:
,其中 可逆 秩相同 - 相似:
Jordan 标准型相同- 同一个线性变换在不同基下的对应矩阵
- 合同:
正负惯性指数相同- 同一个二次型(双线性型)在不同基下的对应矩阵
- 相抵:
- 对于方阵
,谱半径定义为 ;- 对于任意相容范数
,均成立 - 对于任意
,总存在一个相容范数 使得 ,即 收敛;收敛时极限为
- 对于任意相容范数
- 对于方阵
,条件数定义为 ,表征矩阵 对向量的拉伸能力和缩放能力;- 条件数刻画了求解线性方程组
时,误差经过矩阵 的传播扩大为解向量的误差的程度,是衡量线性方程组数值稳定性的重要指标 - 取
,
- 条件数刻画了求解线性方程组
- von Neumann 定理:设
分别有奇异值 和 ,那么- 酉变换:旋转、反射和相位变换的组合
为酉矩阵 正规且- 酉矩阵
的列(行)向量标准正交,进而 - 矩阵经酉变换后迹的实部只减不增当且仅当半正定
- 序列重排不等式:逆序和
乱序和 顺序和
- 矩阵打洞技巧(分块初等变换)
- Schur 补:
- S-procedure(利用优化对偶理论);
- SMW 公式:
;
矩阵分解
矩阵的满秩分解
- 对于
,使用 可以分解为列满秩矩阵 和行满秩矩阵 的乘积,即 ;- 满秩分解一定存在但不唯一,因为
,其中 。 - 相抵标准形:取
,则 。 - 算法:经初等行变换化
为(简化)行阶梯形矩阵
- 满秩分解一定存在但不唯一,因为
- 应用:计算广义逆,解线性方程组
矩阵的三角分解
- LU(Doolittle)分解:对于
,使用 将矩阵 分解为单位下三角形矩阵 和上三角形矩阵 的乘积,即 ;- 设
,则存在行置换阵 (左)和列置换阵 (右)使得 。 - 设
,如果矩阵 的前 阶顺序主子式 ,那么存在 LU 分解 (不一定唯一)。 - 设
,那么 的 LU 分解存在且唯一 其前 阶顺序主子式 。 - 设
,则存在行置换阵 ,使得 。 - 算法:Gauss 消去法(经初等行变换化
为行阶梯形矩阵),(选主元)直接递推法
- 设
- LDU* 分解:将上三角形矩阵
分解为对角矩阵 和单位上三角形矩阵 的乘积,即 ;- 块 LDU 分解:
- L*U*(Crout)分解:记
,有分解 ; - Cholesky 分解(Hermite 三角分解):对于
,有唯一的 LU 分解 ,由于 ,有 ,进而有 ,其中 为下三角形矩阵。- 设
,如果规定下三角形矩阵的对角元素均取正,那么 Cholesky 分解存在且唯一。 - 设
,如果允许下三角形矩阵的对角元素取零,那么 Cholesky 分解存在。 - 算法:直接递推算法,顺序 Cholesky 分解算法(平方根分解算法)
- 设
- 应用:行列式计算,回代法解线性方程组
矩阵的酉三角分解
- QR 分解:对于
,使用 将矩阵 分解为酉矩阵 和上三角形矩阵 的乘积,即 ;- 设
,则存在列置换阵 使得 。 - 设
( ),则 可以分解为 ,其中 为 阶列正交矩阵(即 ), 为 阶上三角形矩阵;如果规定 的对角元素取正,那么分解式唯一。 - 算法:Householder 变换法,Givens 变换法,Gram-Schmidt 正交化方法,修正的 Gram-Schmidt 正交化算法(MGS 算法)
- 设
- 应用:行列式计算,回代法解线性方程
基于特征值(奇异值)的分解
- Jordan 分解:对于
,使用 将矩阵 分解为非奇异矩阵 、Jordan 标准形 和 的逆矩阵的乘积,即 ,其中 $J=\begin{pmatrix}J
\end{pmatrix}$ 为特征值
- Schur 分解:对于
,使用 将矩阵 分解为非奇异矩阵 、Jordan 标准形 和 的逆矩阵的乘积,即 ,其中 $J=\begin{pmatrix}J
\end{pmatrix}$ 为特征值
- 特征值分解:对于可相似对角化矩阵
,使用 将矩阵 分解为非奇异矩阵 、对角矩阵 和 的逆矩阵的乘积,即 ,其中 , 为特征值 对应的特征向量;- 设可相似对角化的矩阵
有 个相异的特征值,那么谱分解 存在且唯一,其中 称为 的谱族,其满足如下条件: ( 个互补的特征子空间的投影矩阵) (代数重数)
- 对于正规矩阵的酉相似特征值分解
,如果规定 中特征值按顺序排列,那么分解式的不唯一性来自于各特征值对应的特征向量取法,对于 重特征值 ,其特征向量集 可取为 ,其中 为酉矩阵。 的特征值分解存在(可相似对角化) 有 个线性无关的特征向量 可酉相似对角化(即 可取为酉矩阵) 为正规矩阵 为 Hermite 矩阵 正规且
可正交相似对角化(即 可取为正交矩阵) 为实对称矩阵- 可相似对角化的同阶方阵
可同时相似对角化 ;实对称矩阵 可同时正交相似对角化 - 对于可相似对角化且特征值全为正值的矩阵的平方根矩阵,有
- 算法:Jacobi 算法,循环 Jacobi 算法,变限值循环 Jacobi 算法(过关 Jacobi 算法),QR 算法
- 设可相似对角化的矩阵
- 奇异值分解:对于
,使用 将矩阵 分解为酉矩阵 、对角矩阵 和 酉矩阵 的乘积,即 ,其中 为奇异值 (矩阵 的特征值 的算术平方根,即 )对应的左、右奇异向量(矩阵 的特征向量);- 如果规定
中奇异值按顺序排列,那么分解式的不唯一性来自于各奇异值对应的左右奇异向量取法,即 ,其中 为相异奇异值的个数, 为酉矩阵。 - 算法:特征值分解法,经 Householder 变换化
为双对角形后进行奇异值分解 - 应用:计算广义逆(解线性方程组),计算矩阵幂级数,主成分分析
- 如果规定
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通