正规矩阵
将学习以什么
关于正规矩阵的基础知识
理解正规矩阵
定义
定义 1: 矩阵 \(A\in M_n\) 称为是正规的,如果 \(AA^*=A^*A\), 也就是,如果 \(A\) 与它的共轭转置可交换。
根据定义可以得出以下结论:
- 如果 \(A\in M_n\) 是正规的,且 \(\alpha \in \mathbb{C}\), 显然 \(\alpha A\) 是正规的. 即正规矩阵类在用复纯量作的乘法运算下是封闭的
- 如果 \(A\in M_n\) 是正规的,又如果 \(B\) 与 \(A\) 酉相似,即存在酉矩阵 \(U\) 使得 \(B=U^*AU\), 由 \(BB^*=(U^*AU)(U^*A^*U)=U^*AA^*U=U^*A^*UU^*AU=B^*B\), 所以 \(B\) 也是正规的,即正规矩阵类在酉相似之下是封闭的
- 如果 \(A\in M_n\) 与 \(B \in M_m\) 是正规的, 显然 \(A\oplus B\in M_{n+m}\) 是正规的. 即正规矩阵类在直和运算下是封闭的
- 如果 \(A\in M_n\) 与 \(B \in M_m\), 如果 \(A\oplus B\in M_{n+m}\) 是正规的,那么 \(A\) 与 \(B\) 也是正规的
- 每个酉矩阵、Hermite 矩阵、斜 Hermite 矩阵、实正交矩阵、实对称矩阵以及实的斜对称矩阵都是正规的
几何角度
对于正规矩阵 \(A\in M_n\), 按列来分划 \(A=[c_1 \quad \cdots \quad c_n]\) 以及 \(A^T=[r_1 \quad \cdots \quad r_n]\), 向量 \(c_j\) 是 \(A\) 的列,而向量 \(r_i^T\) 是 \(A\) 的行. 定义恒等式 \(AA^*=A^*A\) 提示出:\(A\) 是正规的,当且仅当对所有 \(i,j=1,\cdots,n\) 都有 \(c_i^*c_j=\overline{r_i^*r_j}\), 特别地,\(c_i^*c_i=\lVert c_i \rVert _2^2 = \lVert r_i \rVert _2^2=r_i^*r_i\), 所以 \(A\) 的每一列与它对应的行一样,有同样的 Euclid 范数;一列为零当且仅当对应的行为零.
如果 \(A \in M_n(\mathbb{R})\) 是实的正规矩阵,那么对所有 \(i\) 与 \(j\) 都有 \(c_i^Tc_j=\langle c_i,c_j \rangle=\langle r_i, r_j \rangle=r_i^T r_j\). 如果 \(i\) 列与 \(j\) 列不是零,那么 \(i\) 行与 \(j\) 行不是零,且恒等式
\begin{align}
\frac{\langle c_i,c_j \rangle}{\lVert c_i \rVert _2 \lVert c_j \rVert _2} =\frac{\langle r_i, r_j \rangle}{\lVert r_i \rVert _2 \lVert r_j \rVert _2}
\end{align}
告诉我们:\(A\) 的 \(i\) 列与 \(j\) 列的向量之间的角度与 \(A\) 的 \(i\) 行与 \(j\) 行的向量之间的角度是相同的.
对于正规矩阵。关于它的某种为零的分块有某些特殊之处.
引理 1: 设 \(A\in M_n\) 被分划成 \(A=\begin{bmatrix} A_{11} & A_{12} \\ 0 & A_{22} \end{bmatrix}\), 其中 \(A_{11}\) 与 \(A_{22}\) 是方阵. 那么 \(A\) 是正规的,当且仅当 \(A_{11}\) 与 \(A_{22}\) 是正规的,且 \(A_{12}=0\). 分块上三角矩阵是正规的,当且仅当它位于对角线之外的分块是零且每一个对角线上的分块都是正规的. 特别地,上三角矩阵是正规的,当且仅当它是对角的.
证明: 如果 \(A_{11}\) 与 \(A_{22}\) 是正规的,且 \(A_{12}=0\), 那么 \(A=A_{11}\oplus A_{22}\) 就是正规矩阵的直和,故而它是正规的. 反之,如果 \(A\) 是正规的,那么
\begin{align}
AA^*=\begin{bmatrix} A_{11}A_{11}*+A_{12}A_{12}* & \bigstar \\ \bigstar & \bigstar \end{bmatrix}=\begin{bmatrix} A_{11}^*A_{11} & \bigstar \\ \bigstar & \bigstar \end{bmatrix}=A^*A
\end{align}
那么 \(A_{11}^*A_{11}=A_{11}A_{11}^*+A_{12}A_{12}^*\), 它蕴含
\begin{align}
\mathrm{tr}\,A_{11}^*A_{11} & =\mathrm{tr}\,(A_{11}A_{11}*+A_{12}A_{12}*) \notag \\
&=\mathrm{tr}\,A_{11}A_{11}^* + \mathrm{tr}\,A_{12}A_{12}^* =\mathrm{tr}\,A_{11}^*A_{11} + \mathrm{tr}\,A_{12}A_{12}^*
\end{align}
从而 \(\mathrm{tr}\,A_{12}A_{12}^*=0\). 由于 \(\mathrm{tr}\,A_{12}A_{12}^*\) 是 \(A_{12}\) 的元素的绝对值的平方和,由此推出 \(A_{12}=0\). 这样 \(A=A_{11}\oplus A_{22}\) 就是正规的,所以 \(A_{11}\) 与 \(A_{22}\) 都是正规的. 后面的部分用归纳法即可说明.
基本结果
下面对有关正规矩阵的基本结果进行整理分类。
定理 1: 设 \(A=[a_{ij}]\in M_n\) 有特征值 \(\lambda_1,\cdots,\lambda_n\), 则下述诸命题等价.
(a) \(A\) 是正规的
(b) \(A\) 可以酉对角化
(c) \(\sum\limits_{i,j=1}^n \lvert a_{ij} \rvert ^2= \sum\limits_{i=1}^n \lvert \lambda_i \rvert ^2\)
(d) \(A\) 有 \(n\) 个标准正交的特征向量
证明: 由Schur 定理知,\(A\) 可以写成 \(A=UTU^*\), 其中 \(U=[u_1 \quad \cdots \quad u_n]\) 是酉矩阵,而 \(T=[t_{ij}]\in M_n\) 是上三角矩阵. 如果 \(A\) 是正规的,则 \(T\) 亦然(与每一个与 \(A\) 酉相似的矩阵一样). 引理 1 确保了 \(T\) 实际上是对角矩阵,故而 \(T\) 可以酉对角化.
如果存在一个酉矩阵 \(V\), 使得 \(A=V\Lambda V^*\), 且 \(\Lambda=\mathrm{diag}(\lambda_1,\cdots,\lambda_n)\), 那么有 \(\mathrm{tr}\,A^*A=\mathrm{tr}\,\Lambda^*\Lambda\), 这就是 (c) 中的结论.
\(T\) 的对角元素是 \(\lambda_1,\cdots,\lambda_n\), 从而 \(\mathrm{tr}\,A^*A=\mathrm{tr}\,T^*T=\sum\limits_{i=1}^n \lvert \lambda_i \rvert ^2+\sum\limits_{i<j}^n \lvert t_{ij} \rvert ^2\). 于是 (c) 蕴含 \(\sum\limits_{i<j}^n \lvert t_{ij} \rvert ^2=0\), 所以 \(T\) 是对角的. 分解式 \(A=UTU^*\) 等价于等式 \(AU=UT\), 等式是说,对每一个 \(i=1,\cdots,n\) 都有 \(Au_i=t_{ii}u_i\). 从而 \(U\) 的 \(n\) 列是 \(A\) 的标准正交的特征向量.
最后,标准正交组是线性无关的,所以 (d) 确保 \(A\) 可以对角化,且可以选择标准正交化的列作为对角化相似矩阵. 这就意味着 \(A\) 与一个对角矩阵(从而是酉矩阵,也是正规矩阵)酉相似,所以 \(A\) 是正规的.
正规矩阵 \(A\in M_n\) 表示成 \(A=U\Lambda U^*\)(其中 \(U\) 是酉矩阵,而 \(\Lambda\) 是对角矩阵)的表示法称为 \(A\) 的谱分解. 由特征多项式、代数重数与几何重数定义 2.3 知,一个矩阵可对角化,当且仅当它是无亏的, 所以说正规矩阵是无亏的.
一般结果
如果 \(X,Y \in M_{n,k}\) 都有标准正交的列,又如果 \(\mathrm{range}\,X=\mathrm{range}\,Y\), 那么 \(X\) 的每一列都是 \(Y\) 的线性组合,这就是说,对某个 \(G \in M_k\) 有 \(X=YG\). 这样就有 \(I_k=X^*X=(YG)^*(YG)=G^*(Y^*Y)G=G^*G\), 所以 \(G\) 必定是酉矩阵. 这一结果就对如下的唯一性定理的第一部分给出一人几何解释.
定理 2: 设 \(A \in M_n\) 是正规的,且有不同的特征值 \(\lambda_1, \cdots, \lambda_d\), 其重数分别为 \(n_1, \cdots,n_d\). 设 \(\Lambda= \lambda_1 I_{n_1} \oplus \cdots \oplus \lambda_d I_{n_d}\), 并假设 \(U \in M_n\) 是酉矩阵以及 \(A=U \lambda U^*\).
(a) 对某个酉矩阵 \(V \in M_n\) 有 \(A=V \Lambda V^*\), 当且仅当存在酉矩阵 \(W_1, \cdots, W_d\), 每个 \(W_i \in M_{n_i}\), 使得 \(U=V(W_1 \oplus \cdots \oplus W_d)\).
(b) 两个正规矩阵是酉相似的,当且仅当它们有同样的特征值.
证明: (a) 如果 \(U \Lambda U^* = V \Lambda V^*\), 那么 \(\Lambda U^* V=U^*V \Lambda\), 所以 \(W=U^*V\) 是酉矩阵,且与 \(\Lambda\) 可交换,先前结果确保 \(W\) 是与 \(\Lambda\) 共形的分块对角矩阵. 反之,如果 \(U=VW\) 以及 \(W=W_1 \oplus \cdots \oplus W_d\), 其中每一个 \(W_i \in M_{n_i}\), 这样 \(W\) 就与 \(\Lambda\) 可交换,且 \(U \Lambda U^* = VW \Lambda W^*V^*=V \Lambda WW^* V^*=V \Lambda V^*\).
(b) 如果对某个酉矩阵 \(V\) 有 \(B=V\Lambda V^*\), 那么 \((UV^*)B(UV^*)^*=(UV^*)V\Lambda V^*(UV^*)^*=U\Lambda U^*=A\). 反之,如果 \(B\) 与 \(A\) 相似,那么它们有相同的特征值;如果 \(B\) 与一个正规矩阵相似,那么它也是正规的.
两个矩阵有同样的特征值不一定是相似的,定理 2 中(b) 说明了如果它们是正规矩阵,那就肯定是相似的. 接下来注意可交换的正规矩阵可以同时酉对角化.
定理 3: 设 \(\mathcal{N} \in M_n\) 是一个非空的正规矩阵族. 那么 \(\mathcal{N}\) 是一个交换族,当且仅当它是可以同时酉对角化的族. 对任一给定的 \(A_0 \in \mathcal{N}\) 以及对 \(A_0\) 的特征值的任意一个给定的排序 \(\lambda_1, \cdots, \lambda_n\), 都存在一个酉矩阵 \(U \in M_n\), 使得 \(U^*A_0 U= \mathrm{diag} (\lambda_1, \cdots, \lambda_n)\), 且对每个 \(B \in \mathcal{N}\), \(U^*BU\) 都是对角矩阵.
证明:由酉三角化中定理 1.2 知:由复矩阵组成的一个交换族可以通过单独一个酉相似同时化简为上三角型,又已知正规的三角矩阵必定是对角矩阵这一事实即可证明.关于 \(A_0\) 的结论,了解即可.
定理 1 应用于 Hermite 矩阵这种特征情形就会得到一个基本的结果,它称之为关于Hermite 矩阵的谱定理.
定理 4: 设 \(A \in M_n\) 是 Hermite 矩阵且有特征值 \(\lambda_1, \cdots, \lambda_n\), 设 \(\Lambda = \mathrm{diag} (\lambda_1, \cdots, \lambda_n)\).
(a) \(\lambda_1, \cdots, \lambda_n\) 是实数
(b) \(A\) 可以酉对角化
(c) 存在一个酉矩阵 \(U \in M_n\), 使得 \(A=U \Lambda U^*\)
证明: Hermite 对角矩阵的对角元素必定是实数,所以 (a) 就从 (b) 以及如下事实推出: Hermite 矩阵的集合在酉相似之下是封闭的. Hermite 矩阵是正规的,所以可酉对角化. 命题 (c) 是 (b) 的复述并加入了如下信息: \(\Lambda\) 的对角元素必定是 \(A\) 的特征值.
关于实的正规矩阵
实的正规矩阵可能通过复的酉相似对角化. 但是通过实正交相似可以得到何种特殊形式呢?由于实正规矩阵可能有非实的特征值,有可能无法用实相似使之对角化. 然而,每一个实矩阵都与一个实的似三角实正交相似,这个拟三角矩阵必定还是拟对角的,如果它是正规的.
引理 2: 假设 $A=\begin{bmatrix} a & b \\ c &d \end{bmatrix} \in M_2(\mathbb{R}) $ 是正规的,且有一对共轭的非实特征值. 那么 \(c=-b \neq 0\) 且 \(d=a\).
证明: 计算表明:\(AA^T=A^TA\) 当且仅当 \(b^2=c^2\) 且 \(ac+bd=ab+cd\). 如果 \(b=c\), 则 \(A\) 是 Hermite 的,所以上面的定理保证它有两个实的特征值. 这样一来,我们必有 \(b=-c \neq 0\) 以及 \(b(d-a)=b(a-d)\), 这就蕴含 \(a=d\).
定理 4: 设 \(A \in M_n(\mathbb{R})\) 是正规的.
(a) 存在一个实正交矩阵 \(Q \in M_n(\mathbb{R})\), 使得 \(Q^TAQ\) 是实的拟对角矩阵
\begin{align} \label{e5}
A_1 \oplus \cdots \oplus A_m \in M_n(\mathbb{R}), \quad \text{每个},, A_i ,, \text{都是},, 1 \times 1 ,, \text{或},, 2\times 2 ,, \text{的}
\end{align}
它满足下述性质:上式中的那些 \(1\times 1\) 直和项给出 \(A\) 所有实的特征值. \(2 \times 2\) 直和项有特殊的形式
\begin{align} \label{e6}
\begin{bmatrix} a & b \\ -b & a \end{bmatrix}
\end{align}
其中 \(b>0\). 该矩阵是正规的且有特征值 \(a \pm \mathrm{i} b\).
(b) 式 \ref{e5} 中的直和项由 \(A\) 的特征值完全决定,它们可以按照任意预先指定的次序出现.
(c) 两个实的 \(n \times n\) 正规矩阵是实正交相似的,当且仅当它们有同样的特征值.
证明:实 Schur 型 确保 \(A\) 与一个实的上拟三角矩阵实正交相似,它的每一个 \(2 \times 2\) 对角分块有一对非实的共轭特征值. 由于这个拟三角矩阵是正规的,所以它实际上是拟对角的,且它的每一个 \(2 \times 2\) 直和项都是正规的,且有一对共轭的非实特征值. 上一个引理告诉我们:这些 \(2 \times 2\) 直和项中的每一个都有特殊的形式 \ref{e6}, 其中 \(b \neq 0\). 如果必要,我们可以通过矩阵 \(\begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix}\) 做成的相似来确保 \(b>0\). (b) \ref{e5} 中的直和项给出了 \(A\) 所有的特征值,且通过置换相似还能使得这些直和项按照所期望的任何次序排列. (c) 两个有同样的特征值的实的 \(n \times n\) 正规矩阵与同一个形如 \ref{e5} 的直和实正交相似.
上一个定理揭示出实正规矩阵在实正交相似下的标准型. 它引导到实对称矩阵、实的斜对称矩阵以及实正交矩阵在实正交相似之下的标准型.
应该知道什么
- 每个酉矩阵、Hermite 矩阵、斜 Hermite 矩阵、实正交矩阵、实对称矩阵以及实的斜对称矩阵都是正规的
- 正规矩阵类在酉相似和直和之下是封闭的
- 正规矩阵可以酉对角化且是无亏的
- 两个正规矩阵是酉相似的,当且仅当它们有同样的特征值
- 可交换的正规矩阵可以同时酉对角化