文中内容来自Youtube上Trent M Parker的视频以及B站up主DR_CAN,略有补充,此处仅作为个人笔记。
空降:https://www.youtube.com/watch?v=4JLbuE9ColQ&list=PLm8ZSArAXicJpCTKOI0TvO0H6IGlJMu8-&index=31
https://www.bilibili.com/video/BV1fx41137Zm?spm_id_from=333.999.0.0
矩阵对角化复习
- 对于同阶方阵\(A、B\),如果存在可逆矩阵\(U\),使得\(B=U^{-1}AU\),则称\(A\)与\(B\)是相似的,记为\(A\sim B\)。有如下性质:
- 相似矩阵的行列式的值相等
- 相似矩阵或者都可逆或者都不可逆,在可逆的情况下,逆矩阵也相似
- 若\(A\sim B\),则\(A^n\sim B^n\)
若\(A\)和对角阵\(B\)相似,如何求可逆矩阵?
\[\because B=U^{-1}AU\\
\therefore AU=UB\\
假设B=\begin{pmatrix}\lambda_1 & & & 0 \\ & \lambda_2 & & \\ & & \ddots \\0 & & & \lambda_n\end{pmatrix}\\
记可逆矩阵U的列向量为: U=(\alpha_1,\alpha_2,\cdots,\alpha_n)\\
\therefore A(\alpha_1,\alpha_2,\cdots,\alpha_n)=(\alpha_1,\alpha_2,\cdots,\alpha_n)\begin{pmatrix}\lambda_1 & & & 0 \\ & \lambda_2 & & \\ & & \ddots \\0 & & & \lambda_n\end{pmatrix}\\
\therefore (A\alpha_1,A\alpha_2,\cdots,A\alpha_n)=(\lambda_1\alpha_1,\lambda_2\alpha_2,\cdots,\lambda_n\alpha_n)
\]
所以必须满足\(A\alpha_1=\lambda_1\alpha_1,A\alpha_2=\lambda_2\alpha_2,\cdots,A\alpha_n=\lambda_n\alpha_n\)
设\(A\)是\(n\)阶方阵,如果数\(\lambda\)和非零的列向量满足\(A\alpha=\lambda\alpha\),则\(\lambda\)为\(A\)的特征值,\(\alpha\)为\(A\)属于\(\lambda\)的特征向量
几何意义:对于一个向量\(x\),我们将它乘上一个矩阵\(A\),相当于进行一次线性变换,变换后的向量\(Ax\)的方向和长度都发生了变化。而对于一个特定的矩阵,总存在一些特定方向的向量,使得变换后的向量只是改变长度而不改变方向,则该向量即称为矩阵的特征向量,对应的长度即特征向量的特征值
由上有齐次线性方程组:
\[(\lambda I-A)\alpha=0
\]
而要有非零解,行列式的值必须为0,否则满秩,只有唯一解(零解)
则得到特征方程:(\(\lambda\)的\(n\)次方程)
\[|\lambda I-A|=0
\]
展开特征多项式:
\[\left|\begin{array}{c}
\lambda_1-a_{11} & -a_{12} & \cdots & -a_{1n} \\
-a_{21} & \lambda_2-a_{22} & \cdots & -a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
-a_{n1} & \cdots & \cdots & \lambda_n-a_{nn}
\end{array}\right|
\]
只有对角线有\(\lambda\)未知数,所以可知特征值就是方程组的解
对于\(n\)阶方阵,有如下性质:
\[\lambda_1+\lambda_2+\cdots+\lambda_n=a_{11}+a_{22}+\cdots+a_{nn}\\
\lambda_1\lambda_2\cdots\lambda_n=|A|
\]
特征值和特征向量的解法:
第一步:计算行列式\(|\lambda I-A|\),求出特征方程的全部根,即得到\(A\)的全部特征值
第二步:对每个特征值\(\lambda_0\),求齐次线性方程组\((\lambda_0I-A)x=0\)的一个基础解系\(\alpha_1,\alpha_2,\cdots\alpha_s\),并写成列向量的形式,则\(A\)属于\(\lambda_0\)的全部特征向量为:\(k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s\)
例:
\[A=\begin{pmatrix}1 & 2 & 2 \\ 2 & 1 & 2 \\ 2 & 2 & 1\end{pmatrix},\text{求A的全部特征值和特征向量}\\
|\lambda I-A|=\left| \begin{array}{c}\lambda-1 & -2 & -2 \\ -2 & \lambda-1 & -2 \\ -2 & -2 & \lambda-1\end{array}\right|=(\lambda+1)^2(\lambda-5)=0\\
\Rightarrow \lambda_1=-1,\lambda_2=5\\
对于\lambda_1,代入方程组有:(有两个独立变量,线性无关)\\
\begin{cases}-2x_1-2x_2-2x_3=0 \\-2x_1-2x_2-2x_3=0 \\ -2x_1-2x_2-2x_3=0\end{cases}\\
取x_2=1,x_3=0时,x_1=-1\\
取x_2=0,x_3=1时,x_1=-1\\
\therefore \lambda_1的特征向量为:k_1\begin{pmatrix}-1\\1\\0\end{pmatrix}+k_2\begin{pmatrix}-1\\0\\1\end{pmatrix}\\
对于\lambda_2=5,代入方程组有:\\
\begin{cases}4x_1-2x_2-2x_3=0 \\-2x_1+4x_2-2x_3=0 \\ -2x_1-2x_2+4x_3=0\end{cases}\Rightarrow\begin{cases}2x_1-x_2-x_3=0\\0x_1+ x_2-x_3=0\end{cases}\\
取x_2=1时,则x_3=1,x_1=1\\
\therefore \lambda_2的特征向量为:k\begin{pmatrix}1\\1\\1\end{pmatrix},k\neq0
\]
补充性质:相似矩阵具有相同的特征多项式和特征值
定理1:\(n\)阶方阵\(A\)可对角化的充要条件是\(A\)有\(n\)个线性无关的特征向量
定理2:方阵\(A\)属于不同特征值的特征向量线性无关(故只要分别考虑每个特征值对应是否满足即可)
定理3:若\(n\)阶方阵\(A\)有\(n\)个互异的特征值,则\(A\)可对角化
对角化的流程:
1)求解\(|\lambda I-A|=0\)的解,得到全部特征值
2)代入特征值确定基础解系,将不同特征值的基础解系排列得到向量,若个数等于矩阵的阶数,则可对角化
3)最后可逆矩阵\(U=(\alpha_1,\cdots,\alpha_n)\),即所有特征向量(列向量)的组合
4)对角化得到的矩阵\(\Lambda=U^{-1}AU=\begin{pmatrix}\lambda_1 & & & 0 \\ & \lambda_2 & & \\ & & \ddots \\0 & & & \lambda_n\end{pmatrix}\)
或者看下面的:(\(n\)阶矩阵推广即可)
假设\(P=(v_1,v_2)\),其中\(v_1,v_2\)分别为矩阵\(A\)的特征向量(列向量)
则\(AP=A(v_1,v_2)=A\begin{pmatrix}v_{11} & v_{21} \\ v_{12} & v_{22}\end{pmatrix}=\begin{pmatrix}A\begin{bmatrix}v_{11}\\v_{12}\end{bmatrix} &A\begin{bmatrix}v_{21}\\v_{22}\end{bmatrix}\end{pmatrix}\)
因为有:\(Av_1=\lambda_1v_1,Av_2=\lambda_2v_2\)
则\(AP=\begin{pmatrix}\lambda_1v_{11} & \lambda_2v_{21} \\ \lambda_1v_{12} & \lambda_2v_{22}\end{pmatrix}=\begin{pmatrix}v_{11} & v_{21} \\ v_{12} & v_{22}\end{pmatrix}\begin{pmatrix}\lambda_1 & 0\\ 0 & \lambda_2\end{pmatrix}=P\Lambda\)
则\(P^{-1}AP=\Lambda\)
厄米矩阵对角正交化(Orthogonalization)
- 在实空间中,如果矩阵\(A\)满秩,则一定得到实现矩阵的相似对角化,而可逆的对角化矩阵\(P\)就是矩阵\(A\)所有的特征向量组成的矩阵
- 而复空间中与对角变换相对应的就是酉变换,而且我们在之前的文章中已经证明了酉变换不会改变厄米矩阵的本征值,也就是说我们可以通过酉变换实现厄米矩阵的对角化
- 那么这个酉变换矩阵的形式是怎样的呢?我们其实很容易知道应该就是\(A\)的特征向量构成的矩阵,我们这里来证明一下:
知识1中已经指出酉变换矩阵的element是两个基矢的内积,我们令其中一个为\(A\)的特征向量,另一个为基矢量:
\[U_{ij} = \langle \alpha_i | e_j\rangle
\]
其中:
\[\alpha_i = \begin{pmatrix} \alpha_{1i} \\ \alpha_{2i} \\ \vdots \\ \alpha_{ni}\end{pmatrix}, e_j = \begin{pmatrix} 0\\ \vdots \\1_{(j)} \\\vdots \\0 \end{pmatrix}
\]
则:
\[U_{ij} = \alpha^{\dagger}e_j =\begin{pmatrix} \alpha_{1i}^* & \alpha_{2i}^* & \cdots & \alpha_{ni}^*\end{pmatrix} \begin{pmatrix} 0\\ \vdots \\1_{(j)} \\\vdots \\0 \end{pmatrix} = \alpha_{ji}^*
\]
所以酉变换矩阵即:
\[U = \begin{pmatrix}
\alpha_{11}^* & \alpha_{21}^* & \cdots & \alpha_{n1}^*\\
\alpha_{12}^* & \alpha_{22}^* & \cdots & \alpha_{n2}^*\\
\vdots & \vdots & \ddots & \vdots\\
\alpha_{1n}^* & \alpha_{2n}^* & \cdots & \alpha_{nn}^*
\end{pmatrix}
\]
则对应的\(U^{\dagger}\)为:
\[U^{\dagger} = \begin{pmatrix}
\alpha_{11} & \alpha_{12} & \cdots & \alpha_{1n}\\
\alpha_{21} & \alpha_{22} & \cdots & \alpha_{2n}\\
\vdots & \vdots & \ddots & \vdots\\
\alpha_{n1} & \alpha_{n2} & \cdots & \alpha_{nn}
\end{pmatrix}
=\begin{pmatrix} \alpha_1 & \alpha_2 \cdots & \alpha_n\end{pmatrix}
\]
上面\(U^{\dagger}\)就是\(A\)的特征向量组成的矩阵
则:
\[UAU^{\dagger} =
\begin{pmatrix}
\alpha_{11}^* & \alpha_{21}^* & \cdots & \alpha_{n1}^*\\
\alpha_{12}^* & \alpha_{22}^* & \cdots & \alpha_{n2}^*\\
\vdots & \vdots & \ddots & \vdots\\
\alpha_{1n}^* & \alpha_{2n}^* & \cdots & \alpha_{nn}^*
\end{pmatrix}
\begin{pmatrix}
A_{11} & A_{12} & \cdots & A_{1n}\\
A_{21} & A_{22} & \cdots & A_{2n}\\
\vdots & \vdots & \ddots & \vdots\\
A_{n1} & A_{n2} & \cdots & A_{nn}
\end{pmatrix}
\begin{pmatrix}
\alpha_{11} & \alpha_{12} & \cdots & \alpha_{1n}\\
\alpha_{21} & \alpha_{22} & \cdots & \alpha_{2n}\\
\vdots & \vdots & \ddots & \vdots\\
\alpha_{n1} & \alpha_{n2} & \cdots & \alpha_{nn}
\end{pmatrix}\\
=\begin{pmatrix}
\alpha_{1}^*\\ \alpha_{2}^*\\ \vdots \\ \alpha_{n}^*
\end{pmatrix}
A
\begin{pmatrix}
\alpha_1 & \alpha_2 & \cdots & \alpha_n
\end{pmatrix}\\
=\begin{pmatrix}
\alpha_{1}^*\\ \alpha_{2}^*\\ \vdots \\ \alpha_{n}^*
\end{pmatrix}
\begin{pmatrix}
\lambda_1\alpha_1 & \lambda_2\alpha_2 & \cdots & \lambda_n\alpha_n
\end{pmatrix}\\
=\begin{pmatrix}
\lambda_1\alpha_{1}^*\alpha_1 & \lambda_2\alpha_{1}^*\alpha_2 & \cdots \lambda_n\alpha_{1}^*\alpha_n\\
\lambda_1\alpha_{2}^*\alpha_1 & \lambda_2\alpha_{2}^*\alpha_2 & \cdots \lambda_n\alpha_{2}^*\alpha_n\\
\vdots & \vdots & \ddots & \vdots\\
\lambda_1\alpha_{n}^*\alpha_1 & \lambda_2\alpha_{n}^*\alpha_2 & \cdots \lambda_n\alpha_{n}^*\alpha_n
\end{pmatrix}\\
=\begin{pmatrix}
\lambda_1 & 0 & \cdots & 0\\
0 & \lambda_2 & \cdots & 0\\
\vdots & \vdots & \ddots & \vdots\\
0 & 0 & \cdots & \lambda_n
\end{pmatrix}
\]
因此我们得证使得厄米矩阵正交化的酉变换矩阵就是厄米矩阵的特征矩阵
那么我们只要按照实空间对角化的方法一样就可以实现厄米矩阵的对角化了