Gersgorin 圆盘
将学习到什么
好多.
Gersgorin 圆盘定理
对任何 \(A \in M_n\),我们总可以记 \(A=D+B\),其中 \(D=\mathrm{diag}(a_{11},\cdots,a_{nn})\) 集中展现了 \(A\) 的主对角线,而 \(B=A-D\) 的主对角线为零. 如果我们令 \(A_{\varepsilon} = D+\varepsilon B\),那么 \(A_0=D\) 且 \(A_1=A\). \(A_0=D\) 的特征值容易确定. 我们知道,如果 \(\varepsilon\) 足够小,则 \(A_{\varepsilon}\) 的特征值局限在点 \(a_{11},\cdots,a_{nn}\) 的某个很小的领域内. 下面的 Gersgorin 圆盘定理使这个结论变得精确:某些以点 \(a_{ii}\) 为中心的容易计算的圆盘保证包含 \(A\) 的特征值.
定理 1 (Gersgorin):设 \(A=[a_{ij}] \in M_n\),用
\begin{align} \label{e1}
R_i'(A) = \sum_{j\neq i}\lvert a_{ij} \rvert,\quad i=1,\cdots,n
\end{align}
表示 \(A\) 的删去的绝对行和,并考虑 \(n\) 个 Gersgorin 圆盘
\begin{align}
\{ z \in \mathbb{C}:\lvert z-a_{ii} \rvert \leqslant R_i'(A) \},\quad i=1,\cdots,n \notag
\end{align}
则 \(A\) 的特征值就在 Gersgorin 圆盘的并集
\begin{align} \label{e2}
G(A) = \cup_{i=1}^n \{ z \in \mathbb{C}:\lvert z-a_{ii} \rvert \leqslant R_i'(A) \}
\end{align}
之中. 此外,如果这 \(n\) 个组成 \(G(A)\) 的圆盘中有 \(k\) 个的并集构成一个集合 \(G_k(A)\),它与剩下的那 \(n-k\) 个圆盘不相交,那么 \(G_k(A)\) 就恰好包含 \(A\) 的 \(k\) 个特征值(按照它们的代数重数计算).
证明:设 \(\lambda,x\) 是 \(A\) 的一组特征对,所以有 \(Ax=\lambda x\) 以及 \(x=[x_i] \neq 0\). 设 \(p \in \{1,\cdots,n\}\) 是一个指标,它使得 \(\lvert x_p \rvert = \lVert x \rVert _{\infty} = \max\limits_{1 \leqslant i \leqslant n} \lvert x_i \rvert\). 那么对所有 \(i=1,2,\cdots,n\) 都有 \(\lvert x_i\rvert \leqslant x_p \rvert\),而且当然有 \(x_p \neq 0\),这是由于 \(x \neq 0\). 将恒等式 \(Ax=\lambda x\) 两边的第 \(p\) 个元素等同起来就显示有 \(\lambda x_p = \sum\limits_{j=1}^n a_{pj}x_j\),我们将它写成
\begin{align}
x_p(\lambda-a_{pp}) = \sum_{j \neq p}a_{pj}x_j \notag
\end{align}
三角不等式与我们关于 \(x_p\) 的假设确保有
\begin{align}
\lvert x_p \rvert \lvert \lambda - a_{pp} \rvert &= \left\lvert \sum_{j \neq p}a_{pj}x_j \right\rvert \leqslant \sum_{j \neq p} \lvert a_{pj}x_j \rvert = \sum_{j \neq p} \lvert a_{pj} \rvert \lvert x_j \rvert \notag \\
&\leqslant \lvert x_p\rvert \sum_{j \neq p} \lvert a_{pj} \rvert = \lvert x_p \rvert R_p' \notag
\end{align}
由于 \(x\neq 0\),我们得出结论 \(\lvert \lambda-a_{pp}\rvert \leqslant R_p'\),也就是说,\(\lambda\) 在圆盘 \(\{ z \in \mathbb{C}:\lvert z-a_{pp} \rvert \leqslant R_p'(A) \}\) 中. 特别地,\(\lambda\) 在由 \ref{e2} 定义的更大的集合 \(G(A)\) 中. 剩下的结论暂时不证明.
\ref{e2} 中的集合称为 \(A\) 的(关于行的)Gersgorin 集,Gersgorin 圆盘的边界则称为 Gersgorin 圆. 由于 \(A\) 与 \(A^T\) 有同样的特征值,我们可以将 Gersgorin 定理应用于 \(A^T\) 而得到关于 \(A\) 的列的 Gersgorin 圆盘定理. 所产生的集合包含 \(A\) 的特征值,而且它是由 \(A\) 的对角元素所确定的,它的删去的绝对列和是
\begin{align} \label{e2a}
C_j'(A) = \sum_{i \neq j}\lvert a_{ij} \rvert,\quad j=1,\cdots,n
\end{align}
推论 2: \(A=[a_{ij}] \in M_n\) 的特征值在 \(n\) 个圆盘的并集
\begin{align} \label{e4}
\cup_{j=1}^n \{ z \in \mathbb{C}:\lvert z-a_{jj} \rvert \leqslant C_j' \}=G(A^T)
\end{align}
之中. 此外,如果这些圆盘中有 \(k\) 个的并集构成一个集合 \(\mathcal{G}_k(A)\),它与剩下的那 \(n-k\) 个圆盘不相交,那么 \(\mathcal{G}_k(A)\) 就恰好包含 \(A\) 的 \(k\) 个特征值(按照它们的代数重数计算).
由上面两个结论可知 \(A\) 的特征值在 \(G(A) \cap G(A^T)\) 中. 特别地,它们包含 \(A\) 的最大模特征值. 在 \(G(A)\) 的第 \(i\) 个圆盘中离原点最远的那个点的模就是 \(\lvert a_{ii}\rvert +R_i'=\sum\limits_{j=1}^n \lvert a_{ij} \rvert\),所以,这些值中的最大者就是 \(A\) 的谱半径的一个上界. 当然,类似的论证方法也可以对绝对列和来进行.
推论 3:如果 \(A=[a_{ij}]\in M_n\),那么
\begin{align} \label{e5}
\rho(A) \leqslant \min \left\{ \max_i \sum_{j=1}^n \lvert a_{ij} \rvert ,\max_j \sum_{i=1}^n \lvert a_{ij} \rvert \right\}
\end{align}
它说的就是 \(\rho(A) \leqslant \lVert A \rVert _{\infty}\) 以及 \(\rho(A) \leqslant \lVert A \rVert _1\).
由于只要 \(S\) 是非奇异的,\(S^{-1}AS\) 与 \(A\) 就有同样的特征值,故而我们能将 Gersgorin 定理应用于 \(S^{-1}AS\),从而得到 \(A\) 的进一步的特征值的包容集. 一种特别方便的方式是选取 \(S=\mathrm{diag}(p_1,p_2,\cdots,p_n)\),其中所有 \(p_i>0\). 对 \(D^{-1}AD=[p_ja_{ij}/p_i]\) 以及它的转置应用 Gersgorin 圆盘定理就得到下面的结果.
推论 4:设 \(A=[a_{ij}]\in M_n\),并设 \(p_1,p_2,\cdots,p_n\) 是正的实数. 则 \(A\) 的特征值在 \(n\) 个圆盘的并集
\begin{align}
\cup_{i=1}^n \left\{ z \in \mathbb{C}:\lvert z-a_{ii} \rvert \leqslant \frac{1}{p_i} \sum_{j\neq i}p_j \lvert a_{ij} \rvert \right\} = G(D^{-1}AD) \notag
\end{align}
之中. 此外,如果这些圆盘中有 \(k\) 个的并集构成一个集合 \(G_k(D^{-1}AD)\),它与剩下的那 \(n-k\) 个圆盘中的每一个都不相交,那么 \(G_k(D^{-1}AD)\) 就恰好有 \(A\) 的 \(k\) 个特征值(按照它们的代数重数计算). 同样的结论对集合
\begin{align}
\cup_{j=1}^n \left\{ z \in \mathbb{C}:\lvert z-a_{jj} \rvert \leqslant p_j\sum_{i\neq j} \frac{1}{p_i} \lvert a_{ij} \rvert \right\} = G(DATD) \notag
\end{align}
也为真.
下面列个习题. 考虑矩阵
\begin{align}
A=\begin{bmatrix} 7 & -16 & 8 \\ -16 & 7 & -8 \\ 8 & -8 & -5 \end{bmatrix} \notag
\end{align}
由 Gersgorin 定理知:\(A\) 的特征值都在圆盘 \(\{ z \in \mathbb{C}:\lvert z-7\rvert \leqslant 24\} \cup \{ z \in \mathbb{C}:\lvert z-7\rvert \leqslant 24\} \cup \{ z \in \mathbb{C}:\lvert z+5\rvert \leqslant 16\}\),由谱半径 \(\rho(A) \leqslant 31\). 现在考虑 \(D^{-1}AD\),其中 \(D=\mathrm{diag}(p_1,p_2,p_3)\),此时 \(A\) 的特征值应该在圆盘的并集
\begin{align}
\{ z \in \mathbb{C}: \lvert z-7\rvert \leqslant \frac{1}{p_1}(16p_2+8p_3)\} \cup \{ z \in \mathbb{C}: \lvert z-7\rvert \leqslant \frac{1}{p_2}(16p_1+8p_3)\} \cup \{ z \in \mathbb{C}: \lvert z-7\rvert \leqslant \frac{1}{p_3}(8p_1+8p_2)\} \notag
\end{align}
如果想要把谱半径范围进一步缩小,则应该满足
\begin{align}
\begin{cases} 16p_2+8p_3\leqslant 24p_1 \\ 16p_1+8p_3\leqslant 24p_2 \\ 8p_1+8p_2\leqslant 26p_3 \end{cases}\quad \text{即} \quad \begin{cases} 2p_2+p_3\leqslant 3p_1 \\ 2p_1+p_3\leqslant 3p_2 \\ p_1+p_2\leqslant \frac{13}{4}p_3 \end{cases} \notag
\end{align}
不妨取 \(p_1=p_2=1,p_3=\frac{7}{8}\),此时谱半径 \(\rho(A) \leqslant 30\).
引进自由参数的想法也可以用来得到谱半径估计式 \ref{e5} 的一个更加一般的形式.
推论 5:如果 \(A=[a_{ij}]\in M_n\),那么就有
\begin{align}
\rho(A) \leqslant \min_{\substack{p_1,\cdots,p_n>0}} \max_{\substack{1\leqslant i \leqslant n}}\frac{1}{p_i} \sum_{j=1}^n p_j \lvert a_{ij} \rvert \notag
\end{align}
以及
\begin{align}
\rho(A) \leqslant \min_{\substack{p_1,\cdots,p_n>0}} \max_{\substack{1\leqslant j \leqslant n}} p_j \sum_{i=1}^n \frac{1}{p_i} \lvert a_{ij} \rvert \notag
\end{align}
由于方阵非奇异的充分必要条件是零不在它的谱中,因而,建立一些条件将零从包含特征值的已知集合中排除出去,是有意义的.
定义 6:矩阵 \(A=[a_{ij}]\in M_n\) 称为对角占优的,如果
\begin{align}
\lvert a_{ii} \rvert \geqslant \sum_{j \neq i}\lvert a_{ij}\rvert =R_i',\quad \text{对所有}\,\,i=1,\cdots,n \notag
\end{align}
称它是严格对角占优的,如果
\begin{align}
\lvert a_{ii} \rvert > \sum_{j \neq i}\lvert a_{ij}\rvert =R_i',\quad \text{对所有}\,\,i=1,\cdots,n \notag
\end{align}
由所述情况的几何状态明显可以看出,如果 \(A\) 是严格对角占优的,零不可能在任何闭的 Gersgorin 圆盘中. 此外,如果其所有主对角元素 \(a_{ii}\) 是实的且是正的,那么这些圆盘中的每一个都在右半开平面中;如果 \(A\) 是 Hermite 的,那么它的特征值是实数,所以它们必定全都是实的,且是正的. 我们将这些结论总结在下面的定理中,其中的结论 (a) 称为Levy-Desplanques 定理.
定理 7:设 \(A=[a_{ij}]\in M_n\) 是严格对角占优的. 那么
(a) \(A\) 是非奇异的;
(b) 如果对所有 \(i=1,\cdots,n\) 都有 \(a_{ii}>0\),那么 \(A\) 的每个特征值都有正的实部;
(c) 如果 \(A\) 是 Hermite 的,且对所有 \(i=1,\cdots,n\) 都有 \(a_{ii}>0\),那么 \(A\) 是正定的.
如果我们仔细利用推论 4 中额外的参数,我们就能将作为非奇异性的充分条件的严格对角占优假设稍加放松.
定理 8:假设 \(A=[a_{ij}]\in M_n\) 的对角元素是非零的数. 如果 \(A\) 是对角占优的,且对 \(i \in \{1,\cdots,n \}\) 中至少 \(n-1\) 个值有 \(\lvert a_{ii} \rvert >R_i'\),那么它是非奇异的.
证明:直接验证 \(\lvert a_{kk} \rvert = R_k'>0\) 的情况. 在推论 3 中,设对所有 \(i \neq k\) 有 \(p_i=1\),又设 \(p_k=1+\varepsilon\),\(\varepsilon>0\). 那么就有
\begin{align}
\frac{1}{p_k}\sum_{j \neq k}p_j \lvert a_{kj} \rvert = \frac{1}{1+\varepsilon} R_k' < \lvert a_{kk} \rvert,\,\,\text{对任意的}\,\,\varepsilon >0 \notag
\end{align}
以及
\begin{align}
\frac{1}{p_i}\sum_{j \neq i}p_j \lvert a_{ij} \rvert = R_i' +\varepsilon \lvert a_{ik} \rvert,\,\,\text{对所有}\,\,i \neq k \notag
\end{align}
由于对所有 \(i \neq k\) 有 \(R_i'< \lvert a_{ii} \rvert\),故而我们可以选取 \(\varepsilon>0\) 足够小,使得对所有 \(i \neq k\) 有 \(R_i'+\varepsilon \lvert a_{ik}\rvert < \lvert a_{ii} \rvert\). 这样一来,推论 3 确保点 \(z=0\) 被排除在 \(G(D^{-1}AD)\) 之外,由此得出 \(A\) 是非奇异的.
Gersgorin 定理以及它的变形给出 \(A\) 的特征值的包容集,这些包容集仅依赖于 \(A\) 的主对角元素以及它位于对角线之外的元素的绝对值. 利用 \(S^{-1}AS\) 与 \(A\) 有相同的特征值这一事实就引导我们得到推论 4 并导出如下事实:闭集
\begin{align}\label{e12}
\cap_{\substack{D}} G(D^{-1}AD),\quad D=\mathrm{diag}(p_1,\cdots,p_n),\quad \text{所有}\,\, p_i>0
\end{align}
包含 \(A\in M_n\) 的特征值,如果我们打算认可不一定是对角的相似性. 但是如果我们只限于对角相似且只利用主对角元素以及对角线之外元素的绝对值,我们能否做得比 \ref{e12} 更好?答案是否定的,理由如下:设 \(z\) 是集合 \ref{e12} 的边界上的任意一个给定的点. 则 R. Varga 已经证明了:存在一个矩阵 \(B=[b_{ij}]\in M_n\),使得 \(z\) 是 \(B\) 的一个特征值,对所有 \(i=1,\cdots,n\) 都有 \(b_{ii}= a_{ii}\),且对所有 \(i,j=1,\cdots,n\) 都有 \(\lvert b_{ij} \rvert = \lvert a_{ij} \rvert\).
更进一步
严格对角占优足以保证非奇异性,但对角占优则不然. 如果 \(A\) 是对角占优的,那么零不可能在任何 Gersgorin 圆盘的内部.
引理 9:设给定 \(A=[a_{ij}]\in M_n\) 以及 \(\lambda \in \mathbb{C}\). 那么有以下结论.
(a) \(\lambda\) 不在 \(A\) 的任何 Gersgorin 圆盘的内部,当且仅当
\begin{align} \label{e22}
\lvert \lambda-a_{ii} \rvert \geqslant R_i'=\sum_{j\neq i} \lvert a_{ij} \rvert,\quad \text{对所有}\,\,i=1,\cdots,n
\end{align}
(b) 如果 \(\lambda\) 在 \ref{e2} 中的 Gersgorin 集合 \(G(A)\) 的边界上,那么它满足不等式 \ref{e22}.
(c) \(A\) 是对角占优的,当且仅当 \(\lambda=0\) 满足不等式 \ref{e22}.
如果 \(A\) 的一个特征值满足不等式 \ref{e22}(特别地,如果这个特征值是 \(G(A)\) 的一个边界点),那么会发生什么.
引理 10:设 \(\lambda,x\) 是 \(A=[a_{ij}]\in M_n\) 的一个特征对,并假设 \(\lambda\) 满足不等式 \ref{e22}. 那么有以结论.
(a) 如果 \(p\in \{1,\cdots,n\}\) 且 \(\lvert x_p \rvert = \lVert x \rVert _{\infty}\),那么 \(\lvert \lambda -a_{pp} \rvert =R_p'\),即 \(A\) 的第 \(p\) 个 Gersgorin 圆经过 \(\lambda\).
(b) 如果 \(p,q\in \{1,\cdots,n\}\) 且 \(\lvert x_p \rvert = \lVert x \rVert _{\infty}\),且 \(a_{pq} \neq 0\),那么就有 \(\lvert x_q \rvert =\lVert x \rVert _{\infty}\).
上面的引理可以推导出下面有用的结果.
定理 11: 设 \(A\in M_n\),并设 \(\lambda,x=[x_i]\) 是 \(A\) 的一个特征对,其中 \(\lambda\) 满足不等式 \ref{e22}. 如果 \(A\) 的每一个元素都不是零,那么
(a) \(A\) 的每个 Gersgorin 圆都经过 \(\lambda\).
(b) 对所有 \(i=1,\cdots,n\) 都有 \(\lvert x_i \rvert =\lVert x \rVert _{\infty}\).
推论 12:设 \(A=[a_{ij}]\in M_n\),并假设 \(A\) 的每一个元素都不是零. 如果 \(A\) 是对角占优的,又如果存在一个 \(k \in \{1,\cdots,n\}\),使得 \(\lvert a_{kk} \rvert > R_k'\),那么 \(A\) 是非奇异的.
证明:由于 \(A\) 是对角占优的,\(\lambda=0\) 满足不等式 \ref{e22}. 假设条件确保 \(k\) 个 Gersgorin 圆不经过 \(0\),故由上一个定理推出,\(0\) 不是 \(A\) 的特征值.
定义 13:矩阵 \(A=[a_{ij}] \in M_n\) 说成有性质 SC(strong connection,强连接),如果对每一对不同的整数 \(p,q\in \{1,\cdots,n\}\) 都存在一列不同的整数 \(k_1=p,\,\,k_2,\cdots,k_m=q\),使得每一个元素 \(a_{k_1,k_2},a_{k_2,k_3},\cdots,a_{k_{m-1},k_m}\) 都不是零.
考虑 \(p=2,\,\,q=1\) 以及矩阵
\begin{align}
\begin{bmatrix} 4 & 2 & 1 \\ 0 & 1 & 1 \\ 0 & 1 & 1 \end{bmatrix}
\end{align}
那么 \(k_2=3\) 是仅有可能的选择. 但不可能选取 \(k_3=1\),这是因为位置 \((3,1)\) 处的元素是零. 从而,该矩阵没有性质 SC.
利用定义 13 以及引理 10 ,我们可以改进定理 11.
定理 14(Better 定理):设 \(A\in M_n\),并设 \(\lambda,x=[x_i]\) 是 \(A\) 的一个满足不等式 \ref{e22} 的特征对. 如果 \(A\) 有性质 SC,那么
(a) 每一个 Gersgorin 圆都经过 \(\lambda\).
(b) 对所有 \(i=1,\cdots,n\) 都有 \(\lvert x_i \rvert =\lVert x \rVert _{\infty}\).
证明:设 \(p \in \{1,\cdots,n\}\) 是使得 \(\lvert x_p \rvert =\lVert x \rVert _{\infty}\) 成立的一个指标. 那么引理 10a 确保 \(\lvert \lambda-a_{pp} \rvert =R_p'\),所以第 \(p\) 个 Gersgorin 圆经过 \(\lambda\). 设 \(q \in \{1,\cdots,n\}\) 是任意一个使得 \(q\neq p\) 的指标. 因为 \(A\) 有性质 SC,故而存在一列不同的指标 \(k_1=p,\,\,k_2,\cdots,k_m=q\) 使得每一个元素 \(a_{k_1,k_2},a_{k_2,k_3},\cdots,a_{k_{m-1},k_m}\) 都不是零. 由于 \(a_{k_1,k_2}\neq 0\),引理 10b 就确保有 \(\lvert x_{k_2} \rvert =\lVert x \rVert _{\infty}\),而引理 10a 确保有 \(\lvert \lambda-a_{k_2k_2} \rvert =R_{k_2}'\). 按此方法做下去,我们就得出有 \(\lvert x_{k_i} \rvert =\lVert x \rVert _{\infty}\) 以及 \(\lvert \lambda-a_{k_ik_i} \rvert =R_{k_i}'\)(对每一个 \(i=2,\cdots,m\)). 特别地,对 \(i=m\),我们得出结论:第 \(q\) 个 Gersgorin 圆经过 \(\lambda\),且有 \(\lvert x_q \rvert =\lVert x \rVert _{\infty}\).
恰如在推论 12 中那样,现在我们可以得到关于非奇异性的一个有用的充分条件.
推论 15(Better 推论):假设 \(A=[a_{ij}]\in M_n\) 有性质 SC. 如果 \(A\) 是对角占优的,又如果存在一个 \(k \in \{1,\cdots,n\}\),使得 \(\lvert a_{kk} \rvert >R_k'\),那么 \(A\) 是非奇异的.
这个奇怪的性质 SC 是什么?注意:它仅仅包含了 \(A\) 位于对角线之外的元素的位置;其主对角线元素以及主对角线之外的非零元素的值是不相干的. 受这个想法的推动,我们来定义与 \(A\) 有关的两个矩阵.
定义 16: 对任何给定的 \(A=[a_{ij}]\in M_{m,n}\),定义 \(\lVert A \rVert =[\lvert a_{ij} \rvert]\) 以及 \(M(A)=[\mu_{ij}]\),其中 \(\mu_{ij}=1\)(如果 \(a_{ij}\neq 0\))以及 \(\mu_{ij}=0\)(如果 \(a_{ij}=0\)). 矩阵 \(M(A)\) 称为 \(A\) 的指标矩阵.
可以证明:\(A \in M_n\) 有性质 SC,当且仅当或者 \(\lvert A \rvert\)(从而 \(\lvert A \rvert\) 与 \(M(A)\) 两者),或者 \(M(A)\) 有性质 SC.
有性质 SC 陈述中出现的 \(A\) 的非零元素序列可以形象地简述成与 \(A\) 关联的一个图中的某种路径.
定义 17: \(A\in M_n\) 的有向图(记为 \(\Gamma(A)\))是在 \(n\) 个结点 \(P_1,P_2,\cdots,P_n\) 上的这样一个有向图:图 \(\Gamma(A)\) 中从 \(P_i\) 到 \(P_j\) 有一条有向弧存在,当且仅当 \(a_{ij} \neq 0\).
举个例子:
定义 18: 图 \(\Gamma\) 中的一条有向路径 \(\gamma\) 是 \(\Gamma\) 中的一列弧 \(P_{i_1}P_{i_2}\),\(P_{i_2}P_{i_3}\),\(P_{i_3}P_{i_4}\),\(\cdots\). 有向路径 \(\gamma\) 中有序排列的一列结点是 \(P_{i_1},P_{i_2},\cdots\). 一条有向路径的长度就是在该有向路径中弧的个数,如果这个个数是有限的;反之,这条有向路径就被说成有无限的长度. 回路有时称为简单有向回路,是开始与结束都在同一个结点处的有向路径;这个结点在该路径中结点的有序列表中必定恰好出现两次,而在这个结点列表中没有任何其他结点可以出现多于一次. 长度为 \(1\) 的回路称为一个圈或者平凡的回路.
定义 19:一个有向图 \(\Gamma\) 称为是强连通的,如果在 \(\Gamma\) 中每一对不同的结点 \(P_i\),\(P_j\) 之间都有一条长度有限的有向路径,其起点是 \(P_i\),而终点是 \(P_j\).
定理 20:设 \(A \in M_n\). 那么 \(A\) 有性质 SC,当且仅当有向图 \(\Gamma(A)\) 是强连通的.
如果一个有向图 \(\Gamma\) 的每一对结点都属于至少一条回路,则 \(\Gamma\) 是强连通的. 在一个有向图的两个给定的结点有可能有多于一条有向路径,不过这样两条有不同长度的路径有可能不是本质上不同的,其中的一条或许包含一条或多条重复的子路径. 如果我们沿着一条有向路径行走时两次遇到一个给定的结点,那么这条有向路径就能通过删除第一次以及第二次遇到这一结点之间走过的所有中间的弧(不改变其端点)来加以缩减(删去的子图是一条回路,或者包含一条回路).
结论 21: 设 \(\Gamma\) 是 \(n\) 个结点上的一个有向图. 如果在 \(\Gamma\) 的两个给定的结点之间有一条有向路径,那么它们之间就存在一条有向长度不大于 \(n-1\) 的有向路径.
为确定一个给定的矩阵 \(A\) 是否有性质 SC,我们可以检查看 \(\Gamma(A)\) 是否是强连通的. 如果 \(n\) 不大,或者 \(M(A)\) 有特殊的构造,那么就有可能核查 \(\Gamma(A)\) 以确认在每一对结点之间都有一条路径. 换一种方式,下面的定理对于不依赖于视觉查验的计算方法提供了基础.
定理 21: 设 \(A\in M_n\),而 \(P_i\) 与 \(P_j\) 是 \(\Gamma(A)\) 的给定的结点. 则下面诸命题等价.
(a) \(\Gamma(A)\) 中存在一条从 \(P_i\) 到 \(P_j\) 的长度为 \(m\) 的有向路径.
(b) \(\lvert A \rvert ^m\) 的位于 \((i,j)\) 处的元素不为零.
(c) \(M(A)^m\) 的位于 \((i,j)\) 处的元素不为零.
定义 22: 设 \(A=[a_{ij}] \in M_n\). 我们称 \(A \geqslant 0\)(\(A\) 是非负的),如果它所有的元素 \(a_{ij}\) 都是实的且是非负的. 我们称 \(A>0\)(\(A\) 是正的),如果它所有的元素 \(a_{ij}\) 都是实的且是正的.
推论 23:设 \(A \in M_n\). 那么 \(\lvert A \rvert ^m>0\) 当且仅当从 \(\Gamma(A)\) 中的每一个结点 \(P_i\) 到每一个结点 \(P_j\) 都存在 \(\Gamma(A)\) 中的每一条长度为 \(m\) 的有向路径. 同样的结论对 \(M(A)^m\) 也为真.
推论 24:设 \(A\in M_n\). 则下面诸命题等价.
(a) \(A\) 有性质 SC.
(b) \((I+\lvert A \rvert)^{n-1}>0\).
(c) \((I+M(A))^{n-1}>0\).
推论 25:如果 \(A \in M_n\),\(i,j\in \{1,\cdots,n\}\),且 \(i \neq j\),那么 \(\Gamma(A)\) 中有一条从 \(P_i\) 到 \(P_j\) 的路径,当且仅当 \((I+\lvert A \rvert)^{n-1}\) 在位置 \((i,j)\) 处的元素不为零.
我们再引入一个与性质 SC 等价的特征.
定义 26:矩阵 \(A\in M_n\) 称为是可约的,如果存在一个置换矩阵 \(P \in M_n\),使得
\begin{align}
P^TAP=\begin{bmatrix} B & C \\ 0_{n-r,r} & D \end{bmatrix} ,\quad \text{以及}\,\,1 \leqslant r \leqslant n-1
\end{align}
在上面的定义中,我们没有要求分块 \(B,C\) 以及 \(D\) 中任何一个有非零的元素. 我们只要求可以通过某些行以及列的交换产生出左下方那个由零元素组成的 \((n-r)\times r\) 分块. 然而,我们的确要求方阵 \(B\) 与 \(D\) 两者的阶都至少为 \(1\),所以没有任何 \(1\times 1\) 的矩阵是可约的.
定义 27: 矩阵 \(A \in M_n\) 称为不可约的,当且仅当它不是可约的.
定理 28:设 \(A \in M_n\). 则下列诸命题等价.
(a) \(A\) 是不可约的.
(b) \((I+\lvert A \rvert)^{n-1}>0\).
(c) \((I+M(A))^{n-1}>0\).
定理 29:设 \(A \in M_n\). 则以下诸命题等价.
(a) \(A\) 是不可约的.
(b) \((I+\lvert A \rvert)^{n-1}>0\).
(c) \((I+M(A))^{n-1}>0\).
(d) \(\Gamma(A)\) 是强连通的.
(e) \(A\) 有性质 SC.
定义 30: 设 \(A \in M_n\). 我们称 \(A\) 是不可约对角占优的,如果
(a) \(A\) 是不可约的.
(b) \(A\) 是对角占优的,即对所有 \(i=1,\cdots,n\),都有 \(\lvert a_{ii} \rvert \geqslant R_i'(A)\).
(c) 存在一个 \(i \in \{1,\cdots,n\}\),使得 \(\lvert a_{ii} \rvert >R_i'(A)\).
应该知道什么
我们学到的关于不可约矩阵以及在它的 Gersgorin 集合的边界上的任何特征值的知识可以总结如下.
定理 31(Taussky):设 \(A \in M_n\) 是不可约的,并假设 \(\lambda \in \mathbb{C}\) 满足不等式 \ref{e22}. 例如,\(\lambda\) 可能是 Gersgorin 集合 \(G(A)\) 的一个边界点. 如果 \(\lambda\) 是 \(A\) 的一个特征值,那么 \(A\) 的每个 Gersgorin 圆都通过 \(\lambda\). 等价地,如果 \(A\) 的某个 Gersgorin 圆不通过 \(\lambda\),那么它不是 \(A\) 的特征值.
推论 32(Taussky): 设 \(A=[a_{ij}]\in M_n\) 是不可约对角占优的. 那么有以下结论.
(a) \(A\) 是非奇异的.
(b) 如果 \(A\) 的每个主对角线元素都是实的正数,那么 \(A\) 的每个特征值都有正的实部.
(c) 如果 \(A\) 是 Hermite 矩阵且每个主对角元素都是正的,那么 \(A\) 的每个特征值都是正的,即 \(A\) 是正定的.