相合以及对角化
将学习到什么
介绍相合的定义以及其引出的标准型.
相合
定义 1: 设给定 \(A,B \in M_n\),如果存在一个非奇异的矩阵 \(S\),使得
(a) \(B=SAS^*\),那么就说 \(B\) 与 \(A\) 是 * 相合的(也称为星相合的或者共轭相合的).
(b) \(B=SAS^T\),那么就说 \(B\) 与 \(A\) 是 相合的,或者 \(^T\)相合的 (也称为 \(T\) 相合的).
一个矩阵乘以非奇异矩阵不改变其秩的大小,所以相合的( \(\\*\) 相合的)矩阵具有同样的秩. 如果 \(A\) 是 Hermite 的,则 \(SAS^*\) 亦然,此结论即便当 \(S\) 为奇异时也成立;如果 \(A\) 是对称的,则 \(SAS^T\) 亦然,此结论即便当 \(S\) 为奇异时也仍然成立. 我们感兴趣的是保持矩阵类型不变的相合: \(\\*\) 相合对 Hermite 矩阵以及 \(^T\) 相合对对称矩阵. 这两种类型的相合与相似共享一个重要的性质.
定理 1: \(\\*\) 相合与相合都是等价关系
证明: 自反性:\(A=IAI^*\). 对称性:如果 \(A=SBS^*\) 并且 \(S\) 是非奇异的,那么 \(B=S^{-1}A(S^{-1})^*\). 传递性:如果 \(A=S_1BS_1^*\) 且 \(B=S_2CS_2^*\),那么 \(A=(S_1S_2)C(S_1S_2)^*\). 对于 \(^T\) 相合,用同样的方式加以验证.
由相合得到的标准型
对于 \(\\*\) 相合以及 \(^T\) 相合可以得到何种标准型呢?也就是说,如果将 \(M_n\) 分划成 \(\\*\) 相合(\(^T\) 相合)的等价类,对于每一个等价类的标准代表元可以作何种选择呢?首先考虑简单的情形:在 \(\\*\) 相合之下 Hermite 矩阵的标准型以及在 \(^T\) 相合之下复对称矩阵的标准型.
定义 2: 设 \(A \in M_n\) 是 Hermite 的. \(A\) 的惯性指数是有序的三数组
\begin{align}
i(A)=(i_+(A), \quad i_-(A),\quad i_0(A))
\end{align}
其中 \(i_+(A)\) 是 \(A\) 的正的特征值的个数,\(i_-(A)\) 是 \(A\) 的负特征值的个数,而 \(i_0(A)\) 则是 \(A\) 的为零的特征值的个数. \(A\) 的符号差是量 \(i_+(A)-i_-(A)\).
由于 \(A\) 是 Hermite 的(正规的),则其可以酉对角化,对角元为特征值,所以 \(\mathrm{rank}\,A=i_+(A)+i_-(A)\).
设 \(A \in M_n\) 是 Hermite 矩阵,并记 \(A=U\Lambda U^*\),其中 \(\Lambda=\mathrm{diag}(\lambda_1,\cdots, \lambda_n)\),且 \(U\) 是酉矩阵. 为方便起见,假设正的特征值在 \(\Lambda\) 的对角元素中首先出现,接下是负的特征值,最后是为零的特征值. 定义实的非奇异的对角矩阵
\begin{align}
D=\mathrm{diag} ( \underbrace{ \lambda_1^{1/2}, \cdots, \lambda_{i_+(A)}^{1/2}}_{i_+(A)\,\, \text{个元素}} ,\underbrace{ ( \lambda_{i_+(A)+1})^{1/2},\cdots, ( \lambda_{i_+(A)+i_-(A)})^{1/2} }_{i_-(A)\,\, \text{个元素}} ,\underbrace{1, \cdots , 1 }_{i_0(A)\,\, \text{个元素}} )
\end{align}
那么 \(\Lambda = DI(A)D\),其中实矩阵
\begin{align}
I(A)= I_{i_+(A)} \oplus ( -I_{i_-(A)} \oplus ) 0_{i_0(A)}
\end{align}
就是 \(A\) 的惯性矩阵. 最后有 \(A=U\Lambda U^*=UDI(A)DU^*=SI(A)S^*\),其中 \(S=UD\) 是非奇异的. 我们就证明了如下的定理.
定理 2: 每一个 Hermite 矩阵都与它的惯性矩阵 \(\\*\) 相合.
同样地,可以证明:如果 \(A \in M_n(\mathbb{R})\) 是对称的,则 \(A\) 通过一个实矩阵与它的惯性矩阵相合.
惯性矩阵会成为 \(\\*\) 相合于 \(A\) 的矩阵的等价类的一个非常好的标准代表,如果我们知道 \(\\*\) 相合的 Hermite 矩阵有同样的惯性指数. 这就是下一个定理——Sylvester 惯性定律.
定理 3(Sylvester): Hermite 矩阵 \(A,B \in M_n\) 是 \(\\*\) 相合的,当且仅当它们有相同的惯性指数,也就是说,当且仅当它们的正的特征值的个数以及负的特征值的个数相同.
证明: 由于 \(A\) 与 \(B\) 都 \(\\*\) 相合于自己的惯性矩阵,故而如果它们有相同的惯性指数,那么它们必定是 \(\\*\) 相合的. 反过来,假设 \(S \in M_n\) 是非奇异的且 \(A=SBS^*\). 相合的矩阵有同样的秩,所以由此推出 \(i_0(A)=i_0(B)\),从而只要证明 \(i_+(A)=i_+(B)\) 就够了. 设 \(v_1,v_2,\cdots, v_{i_+(A)}\) 是 \(A\) 的与正的特征值 \(\lambda_1(A),\cdots, \lambda_{i_+(A)}\) 相伴的标准正交的特征向量,又设 \(S_+(A)=\mathrm{span} \{v_1,v_2,\cdots, v_{i_+(A)}\}\). 如果 \(x=\alpha_1v_1+\cdots + \alpha_{i_+(A)}v_{i_+(A)} \neq 0\),那么 \(x^*Ax=\lambda_1(A) \lvert \alpha_1 \rvert ^2 + \cdots + \lambda_{i_+(A)}(A) \lvert \alpha_{i_+(A)} \rvert ^2 >0\);即对子空间 \(S_+(A)\) 中所有非零的 \(x\) 都有 \(x^*Ax >0\). 子空间 \(S^*S_+(A)= \{ y:\,\,y=S^*x \,\text{且}\, x \in S_+(A) \}\) 也有维数 \(i_+(A)\). 如果 \(y=S^*x \neq 0\) 且 \(x \in S_+(A)\),那么 \(y^*By=x^*(SBS^*)x=x^*Ax >0\),所以 \(i_+(B) \geqslant i_+(A)\). 在上面的推理过程中将 \(A\) 与 \(B\) 倒过来,就会推出 \(i_+(A) \geqslant i_+(B)\). 所以 \(i_+(A) = i_+(B)\).
由上面的定理可得出:Hermite 矩阵 \(A\in M_n\) 与单位矩阵 \(\\*\) 相合,当且仅当它是正定的.
一个 Hermite 矩阵的按照非增次序排列的特征值各自的符号在 \(\\*\) 相合之下不变,但是它们的大小可以改变. 大小改变的界限范围在如下定量形式的 Sylvester 定理中给出.
定理 4(Ostrowski): 设 \(A,S \in M_n\),其中 \(A\) 是 Hermite 的,而 \(S\) 是非奇异的. 设 \(A\),\(SAS^*\) 以及 \(SS^*\) 的特征值都按照非减的次序排列. 设 $\sigma_1 \geqslant \cdots \geqslant \sigma_n >0 $ 是 \(S\) 的奇异值. 对每个 \(k=1,\cdots, n\). 存在一个正实数 \(\theta_k \in [\sigma_n^2, \sigma_1^2]\),使得
\begin{align}
\lambda_k(SAS^*) = \theta_k\lambda_k(A)
\end{align}
如果在 Ostrowski 定理中有 \(A=I\in M_n\),那么所有 \(\lambda_k(A)=1\) 且 \(\theta_k=\lambda_k(SS^*)=\sigma_{n-k+1}\). 如果 \(S\in M_n\) 是酉矩阵,那么 \(\sigma_1=\sigma_n=1\) 且所有 \(\theta_k=1\),这就表示特征值在酉相似下的不变性.
定理 5: 设 \(A,B \in M_n\) 是对称的. 则存在一个非奇异的 \(S \in M_n\),使得 \(A=SBS^T\) 的充分必要条件是 \(\mathrm{rank}\,A=\mathrm{rank}\,B\).
定义 3: 矩阵 \(A \in M_n\) 称为可共轭对角化的,如果存在一个非奇异的 \(S \in M_n\) 以及一个对角矩阵 \(\Lambda \in M_n\),使得 \(A=S\Lambda \bar{S}^{-1}\).
应该知道什么
- \(\\*\) 相合与相合都是等价关系
- 每一个 Hermite 矩阵都与它的惯性矩阵 \(\\*\) 相合
- 每一个实对称矩阵通过一个实矩阵与它的惯性矩阵相合
- (Sylvester 惯性定律)Hermite 矩阵 \(A,B \in M_n\) 是 \(\\*\) 相合的,当且仅当它们有相同的惯性指数