矩阵的秩性质总结

矩阵的秩用法实在过于灵活,写篇随笔记录一下。

矩阵的秩定义

矩阵的秩常见定义有以下两种:

  • 非零子式的最高阶数。
  • 行(列)向量空间的极大无关组向量个数。

矩阵的秩基本性质

从定义出发不难得到以下性质:

  • \(0\le r(A)\le\min(m,n)\)
  • \(r(A^T)=r(A)\)
  • \(r(kA)=r(A)\) ,要求 \(k\neq 0\)
  • \(r(A)=r(AA^T)=r(A^TA)\)
  • 初等变换不改变矩阵的秩。
  • \(r(A)\) 等于 \(A\) 的标准型中 \(1\) 的个数。
  • \(P,Q\) 可逆,则 \(r(A)=r(PA)=r(AQ)=r(PAQ)\)

第 4 条性质的证明:

为证 \(r(A)=r(A^TA)\) ,只需证 \(Ax=0\)\(A^TAx=0\) 是同解方程组。

\(Ax=0\) ,左乘 \(A^T\) 可知 \(A^TAx=0\)

\(A^TAx=0\) ,左乘 \(x^T\) 可知 \((Ax)^TAx=0\)

\(Ax=(a_1,\cdots,a_n)^T\) ,则 \((Ax)^TAx=\sum_{i=1}^na_i^2=0\) 。因此 \(a_i=0\) ,即 \(Ax=0\)

再用 \(A^T\) 替换 \(A\) 可知 \(r(AA^T)=r(A)\)

矩阵的秩其他性质

性质1、设 \(A_{m\times n},B_{n\times s}\) ,则 \(r(A)+r(B)-n\le r(AB)\le\min(r(A),r(B))\)

推论:特别地,若 \(AB=0\) ,则 \(r(A)+r(B)\le n\)

证明:

\(A\) 的列向量为 \(\alpha_1,\cdots,\alpha_n\) ,则:

\[AB=\begin{pmatrix}b_{11}\alpha_1+\cdots+b_{n1}\alpha_n&\cdots&b_{1s}\alpha_1+\cdots+b_{ns}\alpha_n\\\end{pmatrix} \]

\(\therefore AB\) 的列空间包含在 \(A\) 的列空间中,即 \(r(AB)\le r(A)\) 。同理 \(AB\) 的行空间包含在 \(B\) 的行空间中, \(r(AB)\le r(B)\)

前半部分等给出分块矩阵的秩的性质以后再证。


性质2、\(r\begin{pmatrix}A&0\\0&B\\\end{pmatrix}=r(A)+r(B)\)

证明:

\(P_1AQ_1=\begin{pmatrix}I_{r_1}&0\\0&0\\\end{pmatrix},P_2BQ_2=\begin{pmatrix}I_{r_2}&0\\0&0\\\end{pmatrix}\),其中 \(P_1,P_2,Q_1,Q_2\) 均为初等矩阵乘积。(本质上就是将 \(A,B\) 化为标准型)

\[\begin{pmatrix}P_1&0\\0&P_2\\\end{pmatrix} \times \begin{pmatrix}A&0\\0&B\\\end{pmatrix} \times \begin{pmatrix}Q_1&0\\0&Q_2\\\end{pmatrix} = \begin{pmatrix}P_1AQ_1&0\\0&P_2BQ_2\\\end{pmatrix}\\ \]

\(\because\begin{pmatrix}P_1&0\\0&P_2\\\end{pmatrix},\begin{pmatrix}Q_1&0\\0&Q_2\\\end{pmatrix}\) 满秩, \(\therefore r\begin{pmatrix}A&0\\0&B\\\end{pmatrix}=r_1+r_2=r(A)+r(B)\)


性质3、\(r\begin{pmatrix}A&C\\0&B\\\end{pmatrix}\ge r(A)+r(B),r\begin{pmatrix}A&0\\D&B\\\end{pmatrix}\ge r(A)+r(B)\)

证明:

\(P_1AQ_1=\begin{pmatrix}I_{r_1}&0\\0&0\\\end{pmatrix},P_2BQ_2=\begin{pmatrix}I_{r_2}&0\\0&0\\\end{pmatrix}\),其中 \(P_1,P_2,Q_1,Q_2\) 均为初等矩阵乘积。

\[\begin{pmatrix}P_1&0\\0&P_2\\\end{pmatrix} \times \begin{pmatrix}A&0\\0&B\\\end{pmatrix} \times \begin{pmatrix}Q_1&0\\0&Q_2\\\end{pmatrix} = \begin{pmatrix}P_1AQ_1&P_1CQ_2\\0&P_2BQ_2\\\end{pmatrix}\\ \]

\(\because\begin{pmatrix}P_1&0\\0&P_2\\\end{pmatrix},\begin{pmatrix}Q_1&0\\0&Q_2\\\end{pmatrix}\) 满秩, \(\therefore r\begin{pmatrix}A&C\\0&B\\\end{pmatrix}\ge r_1+r_2=r(A)+r(B)\) ,后半部分同理。


性质4、 \(\max(r(A),r(B))\le r(A,B)\le r(A)+r(B)\)

证明:

\((A,B),A,B\) 的列向量空间分别为 \(W,W_1,W_2\) ,则 \(W_1\subseteq W,W_2\subseteq W\) ,左半部分得证。

\(W\subseteq W_1+W_2\) ,右半部分得证。


性质5、\(|r(A)-r(B)|\le r(A\pm B)\le r(A)+r(B)\)

\((A+B),A,B\) 的列向量空间分别为 \(W,W_1,W_2\) ,则 \(W\subseteq W_1+W_2\) ,右半部分得证。

套用右半部分结论即可证明左半部分。


现在来证明性质1的左半部分(即 \(\texttt{Sylvester}\) 不等式)。

\[\begin{pmatrix}AB&0\\0&I_n\\\end{pmatrix} \Rightarrow \begin{pmatrix}AB&0\\B&I_n\\\end{pmatrix} \Rightarrow \begin{pmatrix}0&-A\\B&I_n\\\end{pmatrix} \Rightarrow \begin{pmatrix}-A&0\\I_n&B\\\end{pmatrix}\\ \]

\[\therefore r(AB)+n=r\begin{pmatrix}AB&0\\0&I_n\\\end{pmatrix}=r\begin{pmatrix}-A&0\\I_n&B\\\end{pmatrix}\ge r(A)+r(B)\\ \]


性质6、(\(\texttt{Frobenius}\) 不等式) \(r(ABC)\ge r(AB)+r(BC)-r(B)\)

\[\begin{pmatrix}ABC&0\\0&B\\\end{pmatrix} \Rightarrow \begin{pmatrix}ABC&0\\AB&B\\\end{pmatrix} \Rightarrow \begin{pmatrix}0&-BC\\AB&B\\\end{pmatrix} \Rightarrow \begin{pmatrix}-BC&0\\B&AB\\\end{pmatrix}\\ \]

\[\therefore r(ABC)+r(B)\ge r(AB)+r(BC)\\ \]

\(\texttt{Sylvester}\) 不等式的证明过程如出一辙。


性质7、 \(r(A)+r(I_n-A)\ge n\) ,当且仅当 \(A\) 是幂等矩阵(\(A^2=A\))时等号成立。

\[\begin{pmatrix}A&0\\0&I_n-A\\\end{pmatrix} \Rightarrow \begin{pmatrix}A&A\\0&I_n-A\\\end{pmatrix} \Rightarrow \begin{pmatrix}A&A\\A&I_n\\\end{pmatrix} \Rightarrow \begin{pmatrix}A-A^2&A\\0&I_n\\\end{pmatrix}\\ \Rightarrow \begin{pmatrix}A-A^2&0\\0&I_n\\\end{pmatrix}\\ \]

\(\therefore r(A)+r(I_n-A)=r(A-A^2)+n\) ,得证。


性质8、 \(r(I_n+A)+r(I_n-A)\ge n\) ,当且仅当 \(A\) 是对合矩阵(\(A^2=I_n\))时等号成立。

\[\begin{pmatrix}I_n+A&0\\0&I_n-A\\\end{pmatrix} \Rightarrow \begin{pmatrix}I_n+A&I_n+A\\0&I_n-A\\\end{pmatrix} \Rightarrow \begin{pmatrix}I_n+A&I_n+A\\I_n+A&2I_n\\\end{pmatrix} \Rightarrow \begin{pmatrix}(I_n+A)-\frac 12(I_n+A)^2&I_n+A\\0&2I_n\\\end{pmatrix} \Rightarrow \begin{pmatrix}\frac 12(I_n-A^2)&0\\0&2I_n\\\end{pmatrix}\\ \]

\(\therefore r(I_n+A)+r(I_n-A)=r(I_n-A^2)+n\) ,得证。


性质9、\(r(A^{n+m})=r(A^n)\) ,若 \(A\) 是幂零矩阵(\(\exist m,A^m=0\)),则 \(A^n=0\)

由性质1, \(n\ge r(A)\ge r(A^2)\ge\cdots\ge 0\)

我们证明 \(r(A^s)=r(A^{s+1})\Rightarrow r(A^{s+1})=r(A^{s+2})\)

事实上,在性质6中令 \(B=A^s,C=A\) 即可得证。

Warning:\(r(A)=r(B)\) 不能推出 \(r(AC)=r(BC)\) !很容易因此伪证,反例 \(A=\begin{pmatrix}1&0\\0&0\end{pmatrix},B=\begin{pmatrix}0&0\\0&1\end{pmatrix},C=\begin{pmatrix}0&0\\1&0\end{pmatrix}\)

\(n\)\(0\) 至多减 \(n\) 次,因此从 \(n\) 次开始矩阵幂的秩一定不再变化。

对幂零矩阵 \(A\) ,若 \(m\le n\) ,两边同乘 \(A^{m-n}\) ;若 \(m\gt n\) ,利用刚刚证明的结论,即可证明 \(A^n=0\)


性质10、\(r(A^*)=\begin{cases}n&r(A)=n\\1&r(A)=n-1\\0&r(A)\le n-2\\\end{cases}\)

\(r(A)=n\) ,则 \(|A^*|=|A|^{n-1}\neq 0\)\(A^*\) 满秩。

\(r(A)=n-1\) ,则 \(A\) 一定存在一个 \(n-1\) 阶子式非零,因此 \(r(A^*)\ge 1\)

\(AA^*=0\) ,由性质1推论知 \(r(A)+r(A^*)\le n\) ,即 \(r(A^*)\le 1\) ,得证。

\(r(A)\le n-2\) ,则任意一个 \(n-1\) 阶子式均为零, \(A^*=0\)

杂题

\(n\) 为奇数, \(AB=0\) ,则 \(r(A^TB+AB^T)\le n-1\)

由性质1推论, \(r(A)+r(B)\le n\) 。由 \(n\) 为奇数,不妨 \(r(A)\le\frac{n-1}2\)

\(\therefore r(A^TB+AB^T)\le r(A^TB)+r(AB^T)\le r(A^T)+r(A)\le n-1\)


\(r(I_n-AB)\le r(I_n-A)+r(I_n-B)\)

\(r(I_n-AB)\le r(I_n-A)+r(A(I_n-B))\le r(I_n-A)+r(I_n-B)\)


\(AB=BA\) ,则 \(r(A+B)+r(AB)\le r(A)+r(B)\)

\[\begin{pmatrix}A&0\\0&B\\\end{pmatrix} \Rightarrow \begin{pmatrix}A&A\\0&B\\\end{pmatrix} \Rightarrow \begin{pmatrix}A&A\\A&A+B\\\end{pmatrix}\\ \]

\[\begin{pmatrix}A&A\\A&A+B\\\end{pmatrix} \times \begin{pmatrix}A+B&0\\-A&I_n\\\end{pmatrix} = \begin{pmatrix}AB&A\\AB-BA&A+B\\\end{pmatrix}\\ \]

\[\therefore r(A)+r(B)=r\begin{pmatrix}A&A\\A&A+B\\\end{pmatrix}\ge r\begin{pmatrix}AB&A\\0&A+B\\\end{pmatrix}\ge r(A+B)+r(AB)\\ \]

怎么想到的?单纯的初等变换能得到 \(A+B\) ,但没办法在保护 \(A+B\) 的前提下得到 \(AB\) ,于是想到矩阵乘法。

为使矩阵乘法后右下角仍为 \(A+B\) ,容易想到右乘矩阵 \(\begin{pmatrix}X&0\\Y&I_n\\\end{pmatrix}\)

\[\begin{pmatrix}A&A\\A&A+B\\\end{pmatrix} \times \begin{pmatrix}X&0\\Y&I_n\\\end{pmatrix} = \begin{pmatrix}A(X+Y)&A\\A(X+Y)+BY&A+B\\\end{pmatrix}\\ \]

\(\begin{cases}A(X+Y)=B\\A(X+Y)+BY=0\end{cases}\) ,结合 \(AB=BA\) 即可解出 \(X=A+B,Y=-A\)

如果选择左乘矩阵 \(\begin{pmatrix}X&Y\\0&I_n\\\end{pmatrix}\) 也行得通,读者可以自行思考。


\(\forall 1\le i\le k\)\(B_i\) 是幂等矩阵, \(A=B_1\cdots B_k\) ,则 \(r(I_n-A)\le k(n-r(A))\)

\[\begin{aligned} &r(I_n-A)\\ &=r\big((I_n-B_1)+B_1(I_n-B_2)+\cdots+B_1\cdots B_{k-1}(I_n-B_k)\big)\\ &\le r(I_n-B_1)+r(B_1(I_n-B_2))+\cdots+r(B_1\cdots B_{k-1}(I_n-B_k))\\ &\le r(I_n-B_1)+r(I_n-B_2)+\cdots+r(I_n-B_k)\\ \end{aligned} \]

由性质7, \(r(I_n-B_i)\le n-r(B_i)\le n-r(A)\) ,得证。

总结

  • 第三类分块初等变换:将某块行左乘 \(B\) 加到另一块行,矩阵的秩不变;将某块列右乘 \(B\) 加到另一块列,矩阵的秩不变。
  • 证明与秩有关的等式或不等式,往往先移项使两边全是加法,常数项当成单位阵的秩,然后拼成分块对角矩阵。
  • 分块初等变换本质上是对秩进行恒等变形,矩阵乘法本质上是对秩进行放缩。
posted @ 2024-10-20 23:04  peiwenjun  阅读(127)  评论(0编辑  收藏  举报