实对称矩阵\(A\)正交相似于对角矩阵,或正交合同于对角矩阵,称为主轴定理,其含义是\(A\)所对应的二次型\(x^TAx\)经正交变换\(x=Qy\)化为对称轴与坐标轴重合的二次型\(y^T\Lambda y\), 即将二次型化为标准形. 该定理在解决二次型相关问题时能发挥重要作用.

例1\(A\)是对称正定矩阵,求证\(x^TAx+y^TA^{-1}y\geqslant 2x^Ty\), 其中\(x,y\)\(n\)维列向量.

证明 由于\(A\)对称,所以存在正交矩阵\(Q\)使得

\[A=Q^T\Lambda Q, \quad A^{-1}=Q^T\Lambda^{-1} Q \]

其中\(\Lambda=\mbox{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)\). 令

\[\bar{x}=Qx=(x_1,x_2,\cdots,x_n)^T, \bar{y}=Qy=(y_1,y_2,\cdots,y_n)^T, \]

\[\begin{aligned} x^TAx+y^TA^{-1}y =& x^TQ^T\Lambda Qx+y^TQ^T\Lambda^{-1}Qy\\ =&\bar{x}^T\Lambda\bar{x}+ \bar{y}^T\Lambda^{-1}\bar{y}\\ =&\sum_{i=1}^n\left( \lambda_ix_i^2+\frac{1}{\lambda_i}y_i^2\right)\\ \geqslant &\sum_{i=1}^n2x_iy_i=2\bar{x}^T\bar{y}=2x^Ty. \end{aligned} \]

例2\(A\)\(n\)阶实对称矩阵,

(1)若\(\lambda_1\leqslant \lambda_2\leqslant\cdots\leqslant\lambda_n\)\(A\)的全部特征值, 则$$\forall X\in \mathbb{R}^n, \quad \lambda_1X^TX\leqslant X^TAX\leqslant \lambda_n X^TX.$$

(2)\(\exists c\in \mathbb{R}^+\) 使得\(\forall X\in \mathbb{R}^n\), \(X^TAX\leqslant cX^TX\).

(3) \(\forall \lambda=\lambda_i\), \(\exists \xi=(c_1,c_2,\ldots,c_n)^T\ne 0\) 使得\(f(\xi)=\lambda\xi^T\xi\).

证明 存在正交矩阵\(Q\), 使得

\[Q^TAQ=Q^{-1}AQ=\mbox{diag}(\lambda_1,\lambda_2,\ldots,\lambda_n). \]

(1) 对\(\forall X\in \mathbb{R}^n\), \(Y=Q^TX\). 则\(Y^TY=y_1^2+y_2^2+\cdots+y_n^2\). 所以

\[\lambda_1X^TX=\lambda_1Y^TY\leqslant f(X) =\lambda_1y_1^2+\lambda_2y_2^2+\cdots+\lambda_ny_n^2\leqslant \lambda_nY^TY=\lambda_nX^TX. \]

(2) 取\(c>\max{|\lambda_1|,|\lambda_2|,\ldots,|\lambda_n|}\), 则对\(\forall X\in \mathbb{R}^n\),

\[\begin{array}{ll} f(X)& =\lambda_1y_1^2+\lambda_2y_2^2+\cdots+\lambda_ny_n^2\\ &<c Y^TY=c(Q^{T}X)^T(Q^{T}X)=cX^T(Q^T)^{T}Q^{T}X=cX^TX \end{array} \]

(3) 取\(\varepsilon_i=(0,\ldots,0,1,0\ldots,0), \xi=Q\varepsilon_i\), 则
\(f(\xi)=g(\varepsilon_i)=\lambda_i\varepsilon^T_i\varepsilon_i=\lambda\xi^T\xi\).

(证法二) 设\(\xi\)是属于特征值\(\lambda\)的特征向量, 则
\(A\xi=\lambda\xi\), 从而

\[f(\xi)=\xi^TA^T\xi=\lambda\xi^T\xi. \]

例3\(A=(a_{ij})\)\(n\)阶实对称矩阵, \(\lambda_1\leqslant\lambda_2\leqslant\cdots\leqslant \lambda_n\)是它的全部特征值. 证明

\[\lambda_1\leqslant a_{ii}\leqslant \lambda_n,\; i=1,2,\cdots,n. \]

证明 由于\(\varepsilon_i^TA\varepsilon_i=a_{ii}\), 且\(\varepsilon_i^T\varepsilon_i=1\), 所以由上题得到
\(\lambda_1\leqslant a_{ii}\leqslant \lambda_n\).

例4\(A\)是秩为\(r\)的复对称矩阵, 证明\(A\)可分解为\(r\)个秩为\(1\)的对称矩阵之和.

证明 存在可逆矩阵\(C\)使得

\[C^TAC=\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right). \]

所以

\[A=(C^{-1})^T\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right) C^{-1}=\sum_{i=1}^r(C^{-1})^TE_{ii}(C^{-1}), \]

其中, \((C^{-1})^TE_{ii}(C^{-1})\)是对称矩阵, 且\(\r((C^{-1})^TE_{ii}(C^{-1}))=1\), \(i=1,2,\cdots,r.\)

例5\(A\)是秩为\(r\)的复对称矩阵, 证明\(A\)可分解为\(A=B^TB\), 其中\(B\)是秩为\(r\)\(n\)阶方阵.

证明 存在可逆矩阵\(C\)使得

\[C^TAC=\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right). \]

所以

\[A=(C^{-1})^T\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right) C^{-1}, \]

\(B=\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right) C^{-1}\), 则\(B\)是秩\(\r(B)=r\)\(n\)阶方阵, 且\(A=B^TB\).

例6\(f(x_1,x_2,\ldots,x_n)=X^TAX\)是一实二次型, 存在\(n\) 维实向量\(X_1,X_2\), 使得\(X^T_1AX_1>0, X^T_2AX_2<0\), 则存在\(n\) 维实向量\(X_0\), 使得\(X^T_0AX_0=0\).

证明 \(f\)可经非退化线性替换\(X=CY\)化为

\[g(Y)=y_1^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_r^2. \]

\(X^T_1AX_1>0, X^T_2AX_2<0\)\(p>0,q=r-p>0\). 所以可取

\[Y_0=(1,0,\ldots,0, 1,0\ldots,0,0,\ldots,0),\quad X_0=CY_0, \]

\(f(X_0)=g(Y_0)=0\).

例7\(n\)阶矩阵\(A\)是实对称矩阵,若\(A\)为半正定矩阵,则\(A^*\)也为半正定矩阵.

证明\({\rm r}(A)<n-1\), \(A^*=O\), 结论成立. 若\({\rm r}(A)=n-1\), 则存在可逆矩阵\(C\)使得

\[C^TAC=\begin{pmatrix} E_{n-1}&O\\ O&0 \end{pmatrix}. \]

两边求伴随,且\((C^T)^*=(C^*)^T\), 由此得到

\[C^*A^*(C^*)^T= \begin{pmatrix} O_{(n-1)\times (n-1)}&O\\ O&1 \end{pmatrix}. \]

由此可得\(A^*\)的正惯性指数=秩=1,因此是半正定矩阵.

引理\(A=(a_{ij})\)\(n\)阶实对称半正定矩阵. 若\(a_{ii}=0\), 则\(a_{ij}\)所在的行、列上的元素全为零,即\(a_{ij}=a_{ji}=0\), \(j=1,2,\cdots,n.\)

证明[反证法]
假设存在某个\(a_{ij}\ne 0\), \(j\ne i\), 则考虑二阶主子式

\[\begin{vmatrix} 0&a_{ij}\\ a_{ji}&a_{jj} \end{vmatrix}=-a_{ij}^2<0 \]

这与\(A\)是半正定矩阵矛盾!

例8[大连市竞赛试题,2012]
\(A,B\)\(n\)阶实对称半正定矩阵,求证:存在实可逆矩阵\(Q\)使得\(Q^TAQ,Q^TBQ\)同时为对角矩阵.

证明 由于\(A,B\)是半正定矩阵,所以存在实可逆矩阵\(C\)使得

\[C^T(A+B)C=\begin{pmatrix}E_r&O\\O&O \end{pmatrix} \]

由于\(C^TAC,C^TBC\)均为半正定矩阵,所以\(C^TAC\)的后\(n-r\)个对角元都为\(0\), 即

\[C^TAC=\begin{pmatrix}H_r&O\\O&O \end{pmatrix} \]

其中\(H_r\)\(r\)阶实对称矩阵. 因此存在正交矩阵\(P_1\)使得\(P_1^TH_rP_1=\mbox{diag}(d_1,d_2,\cdots,d_r)=D_r\). 令

\[P=\begin{pmatrix}P_1&O\\O&E_{n-r} \end{pmatrix},\quad Q=CP \]

\[\begin{array}{l} Q^TAQ=P^T(C^TAC)P= \begin{pmatrix}P_1&O\\O&E_{n-r} \end{pmatrix}^T \begin{pmatrix}H_r&O\\O&O \end{pmatrix} \begin{pmatrix}P_1&O\\O&E_{n-r} \end{pmatrix}= \begin{pmatrix}D_r&O\\O&O \end{pmatrix}\\ Q^T(A+B)Q= \begin{pmatrix}P_1&O\\O&E_{n-r} \end{pmatrix}^T \begin{pmatrix}E_r&O\\O&O \end{pmatrix} \begin{pmatrix}P_1&O\\O&E_{n-r} \end{pmatrix}= \begin{pmatrix}E_r&O\\O&O \end{pmatrix} \end{array} \]

因此

\[Q^TBQ=Q^T(A+B)Q-Q^TAQ=\mbox{diag}(1-d_1,1-d_2,\cdots,1-d_r,0,\cdots,0) \]

也为对角矩阵.

练习[1、全国竞赛试题,2010]
\(A,B\)\(n\)阶实对称半正定矩阵,且满足\(n-1\leqslant \r(A)\leqslant n\). 求证:存在实可逆矩阵\(Q\)使得\(Q^TAQ,Q^TBQ\)同时为对角矩阵.

2、若\(A,B\)为实对称矩阵,且\(A\)为正定矩阵,则\(A,B\)可同时合同于对角矩阵,即存在可逆矩阵\(P\)使得\(P^TAP, P^TBP\)为对角矩阵.

由实对称矩阵\(A\)的合同标准形,利用\(A\)\(B\)的交换性(\(AB=BA\))或反交换性(\(AB=-BA\)), 联合分块矩阵的技巧,可以达到解决问题的目的.

例9[华南理工大学2010,四川师范大学2016] 设\(A,B\)\(n\)阶实对称矩阵,证明:存在正交矩阵\(Q\)使得\(Q^TAQ\)\(Q^TBQ\)同时为对角矩阵当且仅当\(AB=BA\).

证明 必要性:由\((Q^TAQ)(Q^TBQ)=(Q^TBQ)(Q^TAQ)\)\(AB=BA\).

充分性:由于\(A\)是实对称矩阵,所以存在正交矩阵\(P\)使得

\[P^TAP=\mbox{diag}(\lambda_1E_{n_1},\lambda_2 E_{n_2},\cdots,\lambda_sE_{n_s}). \]

其中\(\lambda_1,\lambda_2,\cdots,\lambda_s\)\(A\)的互异特征值. 由\(AB=BA\)

\[(P^TTAP)(P^TBP)=(P^TBP)(P^TAP) \]

\(P^TBP\)作相应分块\(P^TBP=(B_{ij})_{s\times s}\), 代入上式得

\[\begin{aligned} &\begin{pmatrix} \lambda_1E_{n_1}&&&\\ &\lambda_2E_{n_2}&&\\ &&\ddots&\\ &&&\lambda_sE_{n_s} \end{pmatrix} \begin{pmatrix} B_{11}&B_{12}&\cdots&B_{1s}\\ B_{21}&B_{22}&\cdots&B_{2s}\\ \vdots&\vdots&&\vdots\\ B_{s1}&B_{s2}&\cdots&B_{s} \end{pmatrix}\\ =& \begin{pmatrix} B_{11}&B_{12}&\cdots&B_{1s}\\ B_{21}&B_{22}&\cdots&B_{2s}\\ \vdots&\vdots&&\vdots\\ B_{s1}&B_{s2}&\cdots&B_{s} \end{pmatrix} \begin{pmatrix} \lambda_1E_{n_1}&&&\\ &\lambda_2E_{n_2}&&\\ &&\ddots&\\ &&&\lambda_sE_{n_s} \end{pmatrix} \end{aligned} \]

两边分别做乘法,并比较对应的子块,可得

\[P^TBP=\begin{pmatrix} B_{11}&&&\\ &B_{22}&&\\ &&\ddots&\\ &&&B_{ss} \end{pmatrix} \]

由于\(B\)是实对称矩阵,所以\(B_i\)也是实对称矩阵,\(i=1,2,\cdots,s\). 故存在正交矩阵\(P_i\)使得\(P_i^TB_{ii}P=\Lambda_i\), \(i=1,2,\cdots,s\). 令\(T=\mbox{diag}(P_1,P_2,\cdots,P_s)\), \(Q=PT\)为正交矩阵, \(Q^{-1}=Q^T\). 则

\[Q^{-1}BQ= \begin{pmatrix} \Lambda_1&&&\\ &\Lambda_2&&\\ &&\ddots&\\ &&&\Lambda_s \end{pmatrix},\; Q^{-1}AQ=\begin{pmatrix} \lambda_1E_{n_1}&&&\\ &\lambda_2E_{n_2}&&\\ &&\ddots&\\ &&&\lambda_sE_{n_s} \end{pmatrix}. \]

例10\(n\)阶实对称矩阵\(A_1,A_2,\cdots,A_m\)两两可交换,求证:存在正交矩阵\(P\), 使得\(P^TA_iP(1\leqslant i\leqslant m)\)都是对角矩阵.

证明\(\mathscr{A}_i\)是欧氏空间\(V\)上的线性变换使得\(\mathscr{A}_i\)\(V\)的标准正交基下的矩阵是\(A_i\), 对\(n\)用数学归纳法,证明存在由\(\mathscr{A}_1,\mathscr{A}_2, \cdots,\mathscr{A}_m\)的公共特征向量组成的标准正交基. 当\(n-1\)时结论成立,假设结论对\(n-1\)成立,考虑\(n\)的情形.

\(A_i(1\leqslant i\leqslant m)\)可交换知存在\(\mathscr{A}_i(1\leqslant i\leqslant m)\)的公共单位特征向量\(e_1\). 则\(W=e_1^{\bot}\)\(n-1\)\(\mathscr{A}_i(1\leqslant i\leqslant m)\)-不变子空间, 将\(\mathscr{A}_i(1\leqslant i\leqslant m)\)限制在\(W\)上,由归纳假设,存在\(W\)的一组由\(\mathscr{A}_i(1\leqslant i\leqslant m)\)的公共单位特征向量组成的标准正交基\(e_2,\cdots,e_n\). 因此,\(e_1,e_2,\cdots,e_n\)是所要求的标准正交基, 且\(\mathscr{A}_i(1\leqslant i\leqslant m)\)在这组记下的矩阵为对角矩阵.

例11\(A,B\)\(n\)阶实矩阵,\(A\)半正定,且\(AB+BA=O\). 求证: \(AB=BA=O\).

证明 因为\(A\)半正定,则存在正交矩阵\(Q\)使得

\[Q^TAQ=\begin{pmatrix} \lambda_1&&&&&\\ &\ddots&&&&\\ &&\lambda_r&&&\\ &&&0&&\\ &&&&\ddots&\\ &&&&&0 \end{pmatrix} =\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}, \]

其中\(A_1=\begin{pmatrix} \lambda_1&&\\ &\ddots&\\ &&\lambda_r \end{pmatrix}\), \(\lambda_1,\lambda_2,\cdots,\lambda_r\)\(A\)的非零特征值. 所以
\(A=Q\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}Q^T\). 由\(AB+BA=O\)

\[Q\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}Q^TB=BQ\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}Q^T. \]

因此

\[\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}(Q^TBQ)=(Q^TBQ)\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}. \]

\(Q^TBQ=\begin{pmatrix} C_1&C_2\\ C_3&C_4 \end{pmatrix}\), 则

\[\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}\begin{pmatrix} C_1&C_2\\ C_3&C_4 \end{pmatrix}=\begin{pmatrix} C_1&C_2\\ C_3&C_4 \end{pmatrix}\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}. \]

由此得\(\begin{pmatrix} A_1C_1&A_1C_2\\ O&O \end{pmatrix}=-\begin{pmatrix} C_1A_1&O\\ C_3A_1&O \end{pmatrix}\), 从而\(A_1C_1=-C_1A_1\), \(A_1C_2=O\), \(C_3A_1=O\). 由此可得\(C_1=C_2=C_3=O\). 从而\(B=Q\begin{pmatrix} O&O\\ O&C_4 \end{pmatrix}Q^T\). 故

\[AB=Q\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}Q^TQ\begin{pmatrix} O&O\\ O&C_4 \end{pmatrix}Q^T =Q\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}\begin{pmatrix} O&O\\ O&C_4 \end{pmatrix}Q^T=O. \]

于是\(BA=-AB=O\).

若一个命题涉及到两个矩阵\(A,B\), 且满足可同时合同于对角矩阵,则常常需要将这两个矩阵同时合同于对角矩阵或分解为\(A=P^T\Lambda_1P, B=P^T\Lambda_2P\) (其中\(P\)为可逆矩阵,\(\Lambda_i\)为对角矩阵)来解决.

例12\(A,B\)\(n\)阶实对称矩阵且\(B\)正定,求证:

(1) \(|\lambda B-A|=0\)的根全为实数;

(2) 设\(|\lambda B-A|=0\)的根为\(\mu_1\leqslant \mu_2\leqslant \cdots\leqslant \mu_n\), 求\(x^TAx\)在约束条件\(x^TBx=1\)下的最大与最小值分别为\(\mu_1\)\(\mu_n\).

证明 (1)由题设知存在存在可逆矩阵\(P\)使得

\[P^BP=E,\; P^TAP=\mbox{diag}(\mu_1,\mu_2,\cdots,\mu_n), \; \mu_i\in\mathbb{R}. \]

所以

\[0=|\lambda B-A|=|P^T(\lambda B-A)P|= (\lambda-\mu_1)(\lambda-\mu_2)\cdots (\lambda-\mu_n). \]

结论得证.

(2) 令\(x=Py\), 由\(x^TBx=1\)

\[y^Ty=(P^{-1}x)^T(P^{-1}x)=x^T(P^T)^{-1}EP^{-1}x=x^T(P^T)^{-1}P^TBPP^{-1}x=x^TBx=1 \]

所以

\[x^TAx=x^T(P^T)^{-1}P^TAPP^{-1}x=y^T\mbox{diag}(\mu_1,\mu_2,\cdots,\mu_n)y =\mu_1y_1^2+\nu_2y_2^2+\cdots+\mu_ny_n^2. \]

于是

\[\mu_1\leqslant x^TAx\leqslant \mu_n. \]

例13\(A\)\(n\)阶对称正定矩阵,\(x\in \mathbb{R}^n\), 证明:\(0\leqslant x^T(A+xx^T)^{-1}x<1\).

证明\(x=0\)显然,下设\(x\ne 0\). 由题设知存在可逆矩阵\(Q\)使得

\[A=P^TEP,\; xx^T=P^T\mbox{diag}(b,0,\cdots,0)P,\; b>0. \]

\((A+xx^T)^{-1}=P^{-1}D(P^T)^{-1}\), 其中\(D=\mbox{diag}(\frac{1}{1+b}, 1,\cdots,1)\). 令\(x=P^Ty\),, 则\(\mbox{diag}(b,0,\cdots,0)=(P^T)^{-1}xx^TP^{-1}=y^Ty\), 所以可设\(y_1^2=b, y_2^2=\cdots=y_n^2=0\). 从而

\[x^T(A+xx^T)^{-1}x=x^TP^{-1}D(P^T)^{-1}x=y^TDy=\frac{1}{1+b}y_1^2+y_2^2+\cdots+y_n^2=\frac{b}{1+b}. \]

\[0<x^T(A+xx^T)^{-1}x<1. \]

例14\(A,B\)\(n\)阶正定矩阵,求证:

\[\frac{2^{n+1}}{|A+B|}\leqslant \frac{1}{|A|}+ \frac{1}{|B|}. \]

证明 由题设知存在可逆矩阵\(P\)使得

\[A=P^TEP,\quad B=P^T\mbox{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)P,\; \lambda_i\geqslant 0(1\leqslant i\leqslant n) \]

从而

\[|A+B|=|P|^2\prod_{i=1}^n(1+\lambda_i), \; |A|=|P|^2,\; |B|=|P|^2\lambda_1\lambda_2\cdots\lambda_n. \]

从而只需证明

\[\frac{2^{n+1}}{\prod_{i=1}^n(1+\lambda_i)}\leqslant 1+\frac{1}{\lambda_1\lambda_2\cdots\lambda_n}. \]

由于\(1+\lambda_i\geqslant 2\sqrt{\lambda_i}\), 所以式\ref{Inequal}变为
\(\frac{2}{\sqrt{\lambda_1\lambda_2\cdots\lambda_n}}\leqslant 1+\frac{1}{\lambda_1\lambda_2\cdots\lambda_n}\), 即\(\frac{2}{\sqrt{y}}\leqslant 1+\frac{1}{y}\), 其中\(y=\lambda_1\lambda_2\cdots\lambda_n\). 即只需证明\(2y\leqslant (1+y)\sqrt{y}\), 也即\(4y^2\leqslant (1+y)^2y\), 或\(4y\leqslant (1+y)^2\). 这显然成立.