酉相合与复对称矩阵
将要学习到什么
酉相合与复对称矩阵相关知识点.
酉相合
定义 1(酉相合):假设 \(A,B \in M_n\) 是酉相合的,即对某个酉矩阵 \(U \in M_n\) 有 \(A=UBU^T\).
酉相似是在正规矩阵或者 Hermite 矩阵的研究中一种天然的等价关系:\(U^*AU\) 是正规的(Hermite 的),如果 \(U\) 是酉矩阵,且 \(A\) 是正规的(Hermite 的). 酉相合是在复对称矩阵或者复斜对称矩阵的研究中的一种天然的等价关系:\(U^TAU\) 是对称的(斜对称的),如果 \(U\) 是酉矩阵,且 \(A\) 是对称的(斜对称的). 我们在研究酉相合时将会频繁使用这样一个事实:如果 \(A,B \in M_n\) 是酉相合的,那么 \(A \bar{A}\) 与 \(B\bar{B}\) 是酉相似的(\(AA^*\) 与 \(BB^*\) 也是酉相似的),从而有同样的特征值. 反过来不一定成立
在奇异值分解一节里,我们知道:复对称矩阵 \(A\) 酉相合于一个非负的对角矩阵,它的对角元素是 \(A\) 的奇异值. 下面我们指出这个结果是与酉相合有关的一种分解的推论:每一个复矩阵都酉相合于一个分块上三角矩阵,该分块上三角矩阵的对角分块是 \(1 \times 1\) 或者 \(2 \times 2\) 的. 第一步我们指出可以怎样利用 \(A\bar{A}\) 的非负特征值并通过酉相合达到部分的三角化.
引理 1: 设给定 \(A \in M_n\),\(\lambda\) 是 \(A\bar{A}\) 的一个特征值,又设 \(x \in \mathbb{C}^n\) 是 \(A\bar{A}\) 的与 \(\lambda\) 相伴的单位特征向量. 设 \(S=\mathrm{span}\{A\bar{x},x\}\),它的维数是 \(1\) 或者 \(2\).
(a) 如果 \(\mathrm{dim} \, S=1\), 则 \(\lambda\) 是非负的实数,且存在一个单位向量 \(z \in S\),使得 \(A\bar{z} = \sigma z\),其中 \(\sigma \geqslant 0\),且 \(\sigma^2 = \lambda\).
(b) 假设 \(\mathrm{dim} \, S=2\), 如果 \(\lambda\) 是非负的实数,那么存在一个单位向量 \(z \in S\),使得 \(A\bar{z} = \sigma z\),其中 \(\sigma \geqslant 0\),且 \(\sigma^2 = \lambda\). 如果 \(\lambda\) 不是实的,或者是负的实数,那么对每个 \(y \in S\) 就有 \(A\bar{y} \in S\).
证明:(a) 如果 \(\mathrm{dim} \, S=1\),那么 \(\{A\bar{x}, x\}\) 是线性相关的,且对某个 \(\mu \in \mathbb{C}\) 有 \(A\bar{x} = \mu x\). 计算 \(\lambda x = A\bar{A} x= A \overline{A\bar{x}} = \bar{\mu} A \bar{x}= \bar{\mu} \mu x = \lvert \mu \rvert ^2 x\),所以 \(\lvert \mu \rvert ^2 = \lambda\). 选取 \(\theta \in \mathbb{R}\),使得 \(\mathrm{e}^{-2\mathrm{i} \theta} \mu = \lvert \mu \rvert\),又设 \(\sigma = \lvert \mu \rvert\). 那么
\begin{align}
A(\overline{\mathrm{e}^{\mathrm{i} \theta}x}) = \mathrm{e}^{-\mathrm{i} \theta} A \bar{x} = \mathrm{e}^{-\mathrm{i} \theta} \mu x = (\mathrm{e}^{-2\mathrm{i} \theta} \mu ) (\mathrm{e}^{\mathrm{i} \theta} x) = \lvert \mu \rvert (\mathrm{e}^{\mathrm{i} \theta} x) = \sigma (\mathrm{e}^{\mathrm{i} \theta} x)
\end{align}
所以 $z = \mathrm{e}^{\mathrm{i} \theta} x $ 是 \(S\) 中一个单位向量,它使得 \(A\bar{z} = \sigma z\),其中 \(\sigma \geqslant 0\),且 \(\sigma^2 = \lambda\).
(b) 如果 \(\mathrm{dim} \, S=2\),那么 \(\{A\bar{x}, x\}\) 是线性无关的,从而它是 \(S\) 的一个基. 任何 \(y \in S\) 可以表示成 \(y=\alpha A \bar{x}+\beta x\)(对某个 \(\alpha, \beta \in \mathbb{C}\)),且有 \(A \bar{y} = A(\bar{\alpha}\bar{ A}x+\bar{\beta} \bar{ x}) = \bar{\alpha}A\bar{ A}x+\bar{\beta} A\bar{ x} = \bar{\alpha} \lambda x+ \bar{\beta} A\bar{ x} \in S\). 如果 \(\lambda\) 是非负实数,设 \(\sigma = \sqrt{\lambda} \geqslant 0\),并设 \(y=A \bar{x} + \sigma x\),它是非零的,这是由于它是基向量的一个非平凡的线性组合. 那么
\begin{align}
A\bar{y} = A(\bar{A} x+ \sigma \bar{x} )=A\bar{A} x + \sigma A \bar{x} = \lambda x + \sigma A \bar{x} = \sigma ^2 x+ \sigma A \bar{x} = \sigma (A\bar{x}+ \sigma \bar{x}) = \sigma y
\end{align}
所以 \(z = y / \lVert y \rVert _2\) 是 \(S\) 中一个单位向量,它使得 \(A\bar{z} = \sigma z\),其中 \(\sigma \geqslant 0\),且 \(\sigma^2 = \lambda\).
子空间 \(S \subset \mathbb{C}^n\) 称为是 \(A\) 共轭不变的,如果 \(A \in M_n\),且对每个 \(x \in S\) 都有 \(A\bar{x} \in S\). \(A\) 共轭不变性这一概念是 \(A\) 不变量的自然类似. 对每个 \(A \in M_n\),总存在一个一维的 \(A\)-不变子空间:任何一个特征向量张成的子空间. 上一个引理确保每个 \(A \in M_n\),总存在一个维数为 \(1\) 或者 \(2\) 的 \(A\) 共轭不变子空间:如果 \(A\bar{A}\) 有一个非负的特征值,则存在一个维数为 \(1\) 的 \(A\) 共轭不变子空间;如若不然,则存在一个维数为 \(2\) 的 \(A\) 共轭不变子空间.
定理 1: 设给定 \(A \in M_n\),以及 \(p \in \{0,1,\cdots, n\}\). 假设 \(A\bar{A}\) 至少有 \(p\) 个非负的实特征值,其中包括 \(\lambda_1,\cdots, \lambda_p\). 则存在一个酉矩阵 \(U \in M_n\),使得
\begin{align}
A=U \begin{bmatrix} \Lambda & \bigstar \\ 0 & C \end{bmatrix} U^T
\end{align}
其中 \(\Lambda=[d_{ij}] \in M_p\) 是上三角的,对 \(i=1,\cdots, p\) 有 \(d_{ii} = \sqrt{\lambda_i} \geqslant 0\),且 \(C \in M_{n-p}\). 如果 \(A\bar{A}\) 恰好有 \(p\) 个非负的实特征值,那么 \(C\bar{C}\) 没有非负的实特征值.
证明:与在 \(p=0\) 的情形一样,\(n=1\) 的情形也是平凡的,所以我们假设 \(n \geqslant 2\) 且 \(p \geqslant 1\).
考虑如下的化简:设 \(x\) 是 \(A\bar{A}\) 的一个与非负实特征值 \(\lambda\) 相伴的单位特征向量,并设 \(\sigma = \sqrt{\lambda} \geqslant 0\). 上一个引理确保存在一个单位向量 \(z\),使得 \(A\bar{z} = \sigma z\). 设 \(V=[z \quad v_2 \quad \cdots \quad v_n] \in M_n\) 是酉矩阵,并考虑酉相合 \(\bar{V}^TA\bar{V}\). 它的位于 \((1,1)\) 处的元素是 \(z^*A\bar{z}=\sigma z^*z = \sigma\). \(V\) 的列的正交性确保 \(\bar{V}^TA\bar{V}\) 的第一列中其它的元素是零:对 \(i=2,\cdots, n\) 有 \(v_i^*A\bar{z} = \sigma v_i^*z=0\). 于是有
\begin{align}
A=V \begin{bmatrix} \sigma & \bigstar \\ 0 & A_2 \end{bmatrix} V^T, \quad A_2 \in M_{n-1}, \quad \sigma= \sqrt{\lambda} \geqslant 0
\end{align}
以及
\begin{align}
A\bar{A}=V \begin{bmatrix} \sigma^2 & \bigstar \\ 0 & A_2 \bar{A}_2 \end{bmatrix} V^* = \begin{bmatrix} \lambda & \bigstar \\ 0 & A_2 \bar{A}_2 \end{bmatrix}
\end{align}
如果 \(A_2 \in M_{n-p}\) 或者 \(A_2 \bar{A}_2\) 没有非负的实特征值,我们就停止.
如果 \(A_2 \bar{A}_2\) 有一个非负的实特征值,就将上面的化简应用于 \(A_2\). 经过至多 \(p\) 步化简,我们就得到结论中所说的分块形式.
推论 1:设给定 \(A \in M_n\).
(a) 如果存在一个酉矩阵 \(U \in M_n\),使得 \(A=U \Lambda U^T\),且 \(\Lambda\) 是上三角的,那么 \(A \bar{A}\) 的每一个特征值都是非负的.
(b) 如果 \(A \bar{A}\) 有至少 \(n-1\) 个非负的特征值,那么就存在一个酉矩阵 \(U \in M_n\),使得 \(A=U \Lambda U^T\),其中 \(\Lambda=[d_{ij}]\) 是上三角的,每一个 \(d_{ii} \geqslant 0\) 且 \(d_{11}^2,\cdots, d_{nn}^2\) 是 \(A \bar{A}\) 的特征值,它们全都是非负的实数.
(c) (Autonne)如果 \(A\) 是对称的,那么就存在一个酉矩阵 \(U \in M_n\),使得 \(A=U\Sigma U^T\),其中 \(\Sigma\) 是非负的对角矩阵,其对角线上的元素是 \(A\) 的奇异值按照任意你所希望的次序排列.
对 (c) 做一个说明:如果 \(A\) 是对称的,\(A\bar{A} = A\bar{A}^T=AA^*\) 的特征值就是 \(A\) 的奇异值的平方,所以 (a) 确保 \(A=U \Lambda U^T\),其中 \(\Lambda=[d_{ij}]\) 是上三角的,而 \(d_{11},\cdots, d_{nn}\) 则是 \(A\) 的奇异值. 由于 \(\Lambda\) 与对称矩阵 \(A\) 是酉相合的,故而它本身也是对称的,从而是对角的. 对任何置换矩阵 \(P\),我们有 \(A=(UP)(P^T\Lambda P)(UP)^T\),所以这些奇异值可以按照任何所希望的次序排列.
最后给一个定理稍加了解.
定理: 每一个 \(A \in M_n\) 都与一个复对称矩阵相似.
证明:每一个 \(A \in M_n\) 都与 Jordan 块的一个直和相似,而每一个 Jordan 块都与一个对称矩阵相似. 从而,每一个 \(A \in M_n\) 都与对称矩阵和一个直和相似.
应该知道什么
- 酉相合是在复对称矩阵或者复斜对称矩阵的研究中的一种天然的等价关系
- 每个 \(A \in M_n\),总存在一个维数为 \(1\) 或者 \(2\) 的 \(A\) 共轭不变子空间
- 每一个 \(A \in M_n\) 都与一个复对称矩阵相似