3.1 Real Symmetric Matrices and Positive Definiteness 阅读笔记

实对称矩阵与正定性

reference的内容为唯一教程, 接下来的内容仅为本人的课后感悟, 对他人或无法起到任何指导作用.

Reference

  1. Course website: Symmetric Matrices and Positive Definiteness | Linear Algebra | Mathematics | MIT OpenCourseWare
  2. Course video: 【完整版-麻省理工-线性代数】全34讲 配套教材_哔哩哔哩_bilibili
  3. Course summary: Lecture 25: Symmetric matrices and positive definite­ness (mit.edu)
  4. Extra reading: 线性代数与解析几何(第二版)6.2.1 节定理 6.2.3,魏战线 李继成 编

这一个 Unit 的内容比较杂, 前面还是对特征值和特征向量的继续讨论, 只不过对象放到了一类特殊矩阵: 对称矩阵. 有关"对称"的定义, 在实对称矩阵中很直观, 接着我们会发现实对称矩阵的很多性质, 也会引入二次型和正定的定义. 对复矩阵来说, 要考虑的是"共轭对称", 我们会简单说明其在 FFT 中的应用.

接下来的内容就比较散了. SVD, 线性变换与基变换, 伪逆. 其中线性变换与基变换已经早早提到过, 但是在这一讲将会结合 3Blue1Brown 以更宏观的视角关注!

那就先从实对称矩阵开始!

Real Symmetric Matrices

对称矩阵的定义是 A=AT, 实对称矩阵需要保证元素均为实数.

Properties

实对称矩阵有两个特性:

  1. 特征值为实数. (旋转矩阵特征值为纯虚数)
  2. 特征向量相互正交. (可以选出相互正交/ orthonormal 的向量)

在通常(可对角化)情况下, 一个矩阵可以化为: A=SΛS1

在实对称的情况下, 则有 A=QΛQ1, 而对于标准正交矩阵, 有 Q=QT, 所以对称矩阵可以写为

A=QΛQT

又可以写为

Λ=QTAQ

这个分解本身就代表着对称, (QΛQT)T=QΛQT.

Why?

一. 实对称矩阵的特征值为实数.

对于矩阵 Ax=λx, 两边取共轭有A¯x¯=λ¯x¯.

因为实矩阵, 因此有 Ax¯=λ¯x¯, 从这一点也能看出实对称矩阵如果有复特征值则一定共轭成对出现, 对应特征向量也是共轭成对的.

两边取转置, 对称矩阵, 有 x¯TAT=x¯Tλ¯=x¯TA, 对 x¯TAx¯Tλ¯ 右乘 x, 得 x¯TAx=x¯Tλx=x¯Tλ¯x.

因此有 λ¯x¯Tx=λx¯Tx.

而特征向量不可能是零向量, 因此 x¯Tx=[x¯1x¯2x¯n][x1x2xn]=x¯1x1+x¯2x2++x¯nxn=i=1n|xi|2>0. 所以两边消去得到 λ=λ¯, 特征值一定为实数.

二. 实对称矩阵一定可以找出组成标准正交基的特征向量

这个证明相当的麻烦, 我又看了一遍教材才看明白... 用数学归纳法, 当 n=1 的时候, 显然成立, 因为只有一个独立的特征向量 [1].

n=k1,k>2 成立. 则当 n=k 时, 设 λ1k 阶实对称矩阵 Ak 的特征值, x1 为特征向量.

这时我们一定可以将 x1 扩展为 Rn 的标准正交基 [α1αn]. 怎么做呢? 将 x1 单位化得到 α1, 再取零空间 N(α1T) 的标准正交基 (用 Gram-Schmidt 方法) 得到 \begin{bmatrix} \alpha_2 & \cdots & \alpha_n \\end{bmatrix} (显然秩为 1, 解空间维度为 n-1).

P=[α1αn]. 则 AkP=[λ1α1Aα2Aαn]. 通过数感玄学可得:

AkP=[λ1α1Aα2Aαn]=[α1αn][λ1x12x1n00xn2xnn]=P[λ1βT0Ak1]

这里 Ak 是实对称矩阵, Ak=P[λ1βT0Ak1]PT (P 是正交矩阵!). 对称矩阵取转置相同, 因此对 Ak 取转置得

[λ1βT0Ak1]=[λ10TβAk1T]

所以有 β=0, Ak1 也是实对称. (元素一定是实数啊). 根据归纳法, 存在正交矩阵 Qk1 使得 Ak1=Qk1Λk1Qk1T.

通过数感玄学, 令 Qk=P[10T0Qk1], 发现这个矩阵也是正交的. 因为它的逆就是转置. 这时我们再用数感试试 QkTAkQk, 看看等于什么:

QkTAkQk=[100TQk1T][λ10T0Ak1][10T0Qk1]=[λ100TQk1TAk1Qk1]=[λ100TΛk1]=Λk

易证 λ2,,λn 均为 Ak 的特征值, 因此 Qk 就是我们要找的标准正交基, 证毕.

Information about Real Symmetric Matrices

我们现在知道了实对称矩阵特征值和特征向量的信息, 有什么用呢? 接下来从这两个角度来解释一下.

Projection onto Eigenvectors

如果 A=AT, 则有:

A=QΛQT=[q1 q2  qn][λ1λ2λn][q1Tq2TqnT]=λ1q1q1T+λ2q2q2T++λnqnqnT

注意这个展开式中的 qqT, q 是单位列向量所以 qTq=1, 结合投影矩阵的知识有qqTqTq=qqTq 方向上的投影矩阵, 很容易验证其性质. 逆等于转置, 平方不变. 因此:

每一个对称矩阵都可以分解为一系列相互正交的投影矩阵.

Information about Eigenvalues

我们已经知道实数特征值的符号和大小和系统稳定性有关. 对于微分方程 (笔记中跳过了, 详见现代控制理论...), 特征值的正负号会影响微分方程的收敛情况 (原课程第二十三讲, 需要实部为负的特征值保证收敛). 用消元法取得矩阵的主元, 观察主元的符号, 发现:

主元符号的正负数量与特征值的正负数量相同.

再判断大小 (离散系统). 发现 AbI 的特征值会比原来 A 的特征值 λb. 因此求 AbI 有多少个正的主元, 就有多少满足 λb>0, 就能求出多少个 A 的特征值大于 b.

Positive Definite Matrices

如果对称矩阵是"好矩阵", 则正定矩阵 (Positive Definite Matrices) 是其一个更好的子类. 正定矩阵指特征值均为正数的矩阵 (根据上面的性质有矩阵的主元均为正).

举个例子, [5223], 由行列式消元知其主元为 5,115, 于是特征值必然大于零. 果然求特征值有 |5λ223λ|=λ28λ+11=0,λ=4±5. 正定.

正定矩阵的最重要的判断性质是, 各阶顺序主子式大于零. 对上面的例子有|5|=5,|5223|=11.

我们看到正定矩阵将早期学习的的消元主元, 中期学习的的行列式, 后期学习的特征值结合在了一起.

posted @   WIND_LIKE  阅读(111)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 使用C#创建一个MCP客户端
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
Live2D
欢迎阅读『3.1 Real Symmetric Matrices and Positive Definiteness 阅读笔记』
点击右上角即可分享
微信分享提示