矩阵上的向量范数
将要学习到什么
尽管范数的所有公理对于一个有用的关于矩阵“大小”的概念是必须的,对某些重要的应用来说,矩阵范数的次积性公理并非是必要的. 例如,Gelfand 公式并不要求次积性,而且它对向量范数甚至对准范数都是成立的. 在这一节里,我们要讨论矩阵上的向量范数,即在向量空间 \(M_n\) 上不一定有次积性的范数. 我们用 \(G(\cdot)\) 表示 \(M_n\) 上一个通用的向量范数,并首先讨论 \(M_n\) 上某些范数的例子, 这些范数或许是矩阵范数,或许不是.
一些例子
例 1: 如果 \(G(\cdot)\) 是 \(M_n\) 上一个范数,且如果 \(S,T \in M_n\) 是非奇异的,那么
\begin{align}
G_{S,T}(A) = G(SAT), \quad A \in M_n
\end{align}
是 \(M_n\) 上一个范数,即使 \(G(\cdot)\) 是矩阵范数,\(G_{S,T}(\cdot)\) 也不一定是次积性的,除非 \(T=S^{-1}\).
我们来对上例作进一步说明:由于 \(G(\cdot)\) 是矩阵范数,所以 \(G_{S,T}(\cdot)\) 肯定满足非负性、正性、齐次性以及三角不等式的,所以 \(G_{S,T}(\cdot)\) 总是 \(M_n\) 上的范数. 不妨取 \(S=T=\dfrac{1}{2}I\),而 \(G(\cdot)=n\lVert \cdot \rVert_{\infty}\),则可以验证 \(G_{S,T}(\cdot)\) 不一定满足次积性.
例 2: 两个同样大小的矩阵 \(A=[a_{ij}]\) 与 \(B=[b_{ij}]\) 的 Hadamard 乘积是它们逐个元素的乘积 \(A\circ B=[a_{ij}b_{ij}]\). 如果 \(H \in M_n\) 没有为零的元素,又如果 \(G(\cdot)\) 是 \(M_n\) 上任意一个范数,那么
\begin{align} \label{e2}
G_H(A) = G(H\circ A), \quad H \in M_n,\,\,\lvert H \rvert >0
\end{align}
就是 \(M_n\) 上一个范数. 即便 \(G(\cdot)\) 是矩阵范数,\(G_H(\cdot)\) 也不一定是次积性的.
式 \ref{e2} 中的 \(G_H(\cdot)\) 可能是也可能不是矩阵范数,这要视 \(H\) 如何选取而定. 考虑矩阵范数 \(G(\cdot)=\lVert \cdot \rVert_1\),矩阵
\begin{align}
H_1=\begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix} \quad \text{或} \quad H_2=\begin{bmatrix} 2 & 1 \\ 1 & 2 \end{bmatrix}
\end{align}
以及
\begin{align} \label{e4}
A=\begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} , \quad B=\begin{bmatrix} 0 & 0 \\ 1 & 0 \end{bmatrix} \quad \text{以及} \quad AB
\end{align}
注意,对所有 \(C \in M_2\) 有 \(G_{H_1}(C) \leqslant G_{H_2}(C)\)
例 3: 由
\begin{align}
G_C\left(\begin{bmatrix} 1 & b \\ c & d \end{bmatrix}\right) = \dfrac{1}{2}[\lvert a+d \rvert + \lvert a-d \rvert +\lvert b \rvert + \lvert c \rvert]
\end{align}
定义的函数 \(G_C(\cdot)\) 是 \(M_2\) 上的范数,但不是矩阵范数.(考虑矩阵 \ref{e4})
例 4: 如果 \(A \in M_n\),那么集合 \(F(A)=\{x^*Ax:x\in \mathbb{C}^n \,\text{且}\, x^*x=1\}\) 是 \(A\) 的值域或者取值范围,而函数
\begin{align}
r(A)=\max\limits_{\lVert x\rVert_2=1} \lvert x^*Ax \rvert = \max \{ \lvert z \rvert :z\in F(A)\}
\end{align}
就是 \(A\) 的数值半径. \(r(\cdot)\) 是 \(M_n\) 上一个范数,但不是矩阵范数.
例 5: \(M_n\) 上的 \(l_{\infty}\) 范数是
\begin{align}
\lVert A\rVert_{\infty}=\max\limits_{1\leqslant i,j \leqslant n} \lvert a_{ij} \rvert
\end{align}
是 \(M_n\) 是的一个范数,但不是矩阵范数. 然而 \(n\lVert A\rVert_{\infty}\) 是矩阵范数.
上一个例子说明:\(M_n\) 上有许多并非矩阵范数的范数. 这些范数中有一些具有矩阵范数的由次积性推出的某些性质,而有一些则不具有这些性质. 但是 \(M_n\) 上每一个范数都与任何一个矩阵范数等价(在它们有同样的收敛序列这个意义下).
重要定理
定理 4 有更一般的结果.
定理 1: 设 \(f\) 是 \(M_n\) 上的准范数,即是 \(M_n\) 上一个正的、齐次且连续的实值函数,
(a) 正的:对所有 \(x \in V\) 有 \(f_i(x) \geqslant 0\),又设 \(f_i(x) = 0\) 当且仅当 \(x=0\)
(b) 齐性的:对所有 \(\alpha \in \mathbf{F}\) 以及所有 \(x \in V\) 有 \(f_i(\alpha x) =\lvert \alpha \rvert f_i(x)\)
(c) 连续的:\(f_1(x(z))\) 在 \(\mathbf{F}^n\) 上关于 Euclid 范数是连续的
又设 \(\lVert \cdot \rVert\) 是 \(M_n\) 上一个矩阵范数. 那么就存在有限的正常数 \(C_m\) 以及 \(C_M\),使得对所有 \(A \in M_n\) 都有
\begin{align}\label{e9}
C_m\lVert A \rVert \leqslant f(A) \leqslant C_M\lVert A \rVert
\end{align}
特别地,如果 \(f(\cdot)\) 是 \(M_n\) 上一个向量范数,则这些不等式成立.
界限 \ref{e9} 在将有关矩阵范数的结论推广到矩阵上的向量范数时,或者更一般地,推广到矩阵上的准范数时常常是有用的. 例如按照这种方式 Gelfand 公式得以推广.
定理 2:如果 \(f\) 是 \(M_n\) 上一个准范数,特别地,如果它是一个向量范数,那么对所有 \(A\in M_n\) 都有 \(\lim\limits_{k \rightarrow \infty} [f(A^k)]^{1/k}=\rho(A)\).
证明:设 \(\lVert \cdot \rVert\) 是 \(M_n\) 上一个矩阵范数并考虑不等式 \ref{e9},此不等式蕴含对所有 \(k=1,2,3,\cdots\) 都有
\begin{align}
C_m^{1/k}\lVert A^k \rVert^{1/k} \leqslant [f(Ak)] \leqslant C_M^{1/k}\lVert A^k \rVert^{1/k}
\end{align}
但是 \(C_m^{1/k} \rightarrow 1\), \(C_M^{1/k} \rightarrow 1\),且当 \(k\rightarrow \infty\) 时有 \(\lVert A^k \rVert^{1/k} \rightarrow \rho(A)\),故而我们断定 \(\lim\limits_{k \rightarrow \infty} [f(A^k)]^{1/k}\) 存在且有结论中的值.
例 5 展现了第二种含义,按照这种含义,\(M_n\) 上的任何范数都等价于一个矩阵范数. 范数 \(\lVert \cdot \rVert_{\infty}\) 的一个正的纯量倍数是一个矩阵范数. 这并不意外:\(M_n\) 上的每个范数在乘了一个适当的正整数之后都变成了矩阵范数. 这个基本结果是范数函数的连续性以及单位球面的紧性的一个推论.
定理 3: 设 \(G(\cdot)\) 是 \(M_n\) 上一个向量范数,又设
\begin{align}
c(G)=\max\limits_{G(A)=1=G(B)} G(AB)
\end{align}
对一个正的实纯量 \(\gamma\),\(\gamma G(\cdot)\) 是 \(M_n\) 上一个矩阵范数的充分必要条件是 \(\gamma \geqslant c(G)\). 如果 \(\lVert \cdot \rVert\) 是 \(M_n\) 上一个矩阵范数,而 \(C_n\) 与 \(C_M\) 是满足
\begin{align}
C_m\lVert A \rVert \leqslant G(A) \leqslant C_M\lVert A \rVert, \quad \text{对所有}\,\,A\in M_n
\end{align}
的正常数,又如果我们令 \(\gamma_0=c_M / C_m^2\),那么 \(\gamma_0G(\cdot)\) 就是一个矩阵范数,从而有 \(\gamma_0 \geqslant c(G)\).
矩阵范数 \(\lVert \cdot \rVert\) 的一个重要性质是:它是谱占优的,即对每一个 \(A \in M_n\) 都有 \(\lVert A \rVert \geqslant \rho(A)\). 值得一提的是,\(M_n\) 上的向量范数即使不是次积性的,也可能是谱占优的. 现在我们还研究这种情况何时可能发生.
相容
定义 4: \(\mathbb{C}^n\) 上的范数 \(\lVert \cdot \rVert\) 以及 \(M_n\) 上的向量范数 \(G(\cdot)\) 称为相容的,如果对所有 \(x \in \mathbb{C}^n\) 以及所有 \(A \in M_n\) 都有 \(\lVert Ax \rVert \leqslant G(A) \lVert x \rVert\). 有时也用术语相容的,有时也称范数 \(\lVert \cdot \rVert\) 从属于范数 \(G(\cdot)\).
定理 5:如果 \(\lVert \cdot \rVert\) 是 \(M_n\) 上一个矩阵范数,那么就存在 \(\mathbb{C}^n\) 上一个与之相容的范数. 如果 \(\lVert \cdot \rVert\) 是 \(\mathbb{C}^n\) 上的一个范数,那么就存在 \(M_n\) 上一个与之相容的矩阵范数.
证明:对任何非零的向量 \(z\),定义范数 \(\lVert x \rVert _z = \lVert xz^* \rVert\),对任意 \(x \in \mathbb{C}^n\),则其与给定的矩阵范数 \(\lVert \cdot \rVert\) 是相容的:\(\lVert Ax \rVert _z = \lVert Axz^* \rVert \leqslant \lVert A \rVert \lVert xz^* \rVert = \lVert A \rVert \lVert x \rVert _z\). \(\mathbb{C}^n\) 上任意给定的范数与它所诱导的 \(M_n\) 上的矩阵范数都是相容的(定理 2b).
定理 6:设 \(G(\cdot)\) 是 \(M_n\) 上一个范数,它与 \(\mathbb{C}^n\) 上一个范数 \(\lVert \cdot \rVert\) 相容. 那么
\begin{align} \label{e15}
G(A_1)\cdots G(A_k) \geqslant \rho(A_1\cdots A_k), \quad \text{对所有}\,\,A_1,\cdots,A_k \in M_n,\,\,k=1,2,\cdots
\end{align}
特别地,\(G(A)\) 是谱占优的.
证明:考虑 \(k=2\) 的情形,并设 \(x \in \mathbb{C}^n\) 是一个非零向量,它使得 \(A_1A_2x =\lambda x\),其中 \(\lvert \lambda \rvert =\rho(A_1A_2)\). 那么
\begin{align}
\rho(A_1A_2) \lVert x \rVert &= \lVert \lambda x \rVert = \lVert A_1A_2 x \rVert = \lVert A_1(A_2 x) \rVert \notag \\
& \leqslant G(A_1) \lVert A_2 x \rVert \leqslant G(A_1) G(A_2)\lVert x \rVert \notag
\end{align}
由于 \(\lVert x \rVert \neq 0\),我们断言 \(\rho(A_1A_2) \lVert x \rVert \leqslant G(A_1) G(A_2)\). 一般情形由归纳法得出.
\(M_n\) 上哪一个向量范数与 \(\mathbb{C}^n\) 上某个范数相容的?条件 \ref{e15} 是必要的. 为了证明它也是充分的,我们需要一个技术性的引理.
引理 7: 设 \(G(\cdot)\) 是 \(M_n\) 上一个满足条件 \ref{e15} 向量范数. 则存在一个有限的正常数 \(\gamma(G)\),使得对所有 \(A_1,A_2,\cdots,A_k \in M_n\) 以及所有 \(k=1,2,\cdots\) 都有
\begin{align}
G(A_1)\cdots G(A_k) \geqslant \gamma(G) \lVert A_1\cdots A_k)\rVert_2
\end{align}
证明: 设 \(k\) 是一个给定的正整数,给定 \(A_1,A_2,\cdots,A_k \in M_n\),又设 \(A_1\cdots A_k=V\Sigma W^*\) 是奇异值分解. 假设条件允许我们利用 \ref{e15} 计算
\begin{align}
G(V^*)G(A_1)\cdots G(A_k)G(W)&\geqslant \rho(V^*A_1\cdots A_kW)=\rho(\Sigma)= \lVert \Sigma \rVert_2 \notag \\
&= \lVert V^*A_1\cdots A_kW \rVert_2 = \lVert A_1\cdots A_k \rVert_2 \notag
\end{align}
最后一个等式是由这个谱范数的酉不变性得出. 由于 \(G(\cdot)\) 是在酉矩阵组成的紧集上的一个连续函数,\(\mu(G)=\max \{G(U):U \in M_n \,\,\text{是酉矩阵}\}\) 是一个有限的正数. 我们断定有
\begin{align}
G(A_1)\cdots G(A_k) &\geqslant \frac{1}{G(V^*)G(W)} \lVert A_1\cdots A_k)\rVert_2 \notag \\
& \geqslant \mu(G)^{-2}\lVert A_1\cdots A_k)\rVert_2 \notag
\end{align}
定理 8: \(M_n\) 上一个向量范数 \(G(\cdot)\) 与 \(\mathbb{C}^n\) 上某个范数相容,当且仅当它满足不等式 \ref{e15}.
证明: 定理 6 已经证明了其中的一个蕴含关系. 为证明另一个蕴含关系,我们认为只要证明存在 \(M_n\) 上一个矩阵范数 \(\Vert \cdot \rVert\),使得对所有 \(A \in M_n\) 都有 \(G(A) \geqslant \lVert A \rVert\) 即可. 如果这样的矩阵范数存在,设 \(\Vert \cdot \rVert\) 是 \(\mathbb{C}^n\) 上一个与之相容的范数,并设给定 \(x \in \mathbb{C}^n\) 以及 \(A \in M_n\). 那么 \(\Vert Ax \rVert \leqslant \Vert A \rVert \Vert x \rVert \leqslant G(A) \Vert x \rVert\),所以范数 \(\Vert \cdot \rVert\) 也是与 \(G(\cdot)\) 相容的. 对于给定的 \(A \in M_n\),有多种方法将它表示成矩阵的乘积或者矩阵乘积之和. 定义
\begin{align}
\lVert A \rVert = \inf \left\{ \sum_i G(A_{i1} \cdots \sum_i G(A_{ik_i} ) : \sum_i A_{i1}\cdots A_{ik_i}=A,\,\,\text{每一个}\,\,A_{ij} \in M_n \right\}
\end{align}
函数 \(\Vert \cdot \rVert\) 是非负齐次的. 它是取正值的吗?如果 \(\sum_i A_{i1}\cdots A_{ik_i}=A \neq 0\),那么引理 7 以及关于谱范数的三角不等式确保有
\begin{align}
\sum_i G(A_{i1} \cdots \sum_i G(A_{ik_i} ) & \geqslant \sum_i \gamma(G) \lVert A_{i1}\cdots A_{ik_i})\rVert_2 \notag \\
& \geqslant \gamma(G)\lVert \sum_i A_{i1}\cdots A_{ik_i})\rVert_2 = \gamma(G) \lVert A \rVert _2 >0 \notag
\end{align}
所以 \(\Vert \cdot \rVert\) 是正的. 关于 \(\Vert \cdot \rVert\) 的三角不等式以及次积性由它作为乘积之和的下确界这一定义得出.
我们已经看到,\(M_n\) 上某些向量范数在 \(\mathbb{C}^n\) 上有相容的范数,而有一些则没有. 那些有相容范数的是谱占优的;而那些没有相容范数的有可能是谱占优的,也有可能不是谱占优的. 我们有必要与充分的条件还判断 \(M_n\) 上一个向量范数在 \(\mathbb{C}^n\) 上 是否有某个相容的范数. 什么时候 \(\mathbb{C}^n\) 上的范数与 \(M_n\) 上非次积性的范数相容呢?结论是永远如此.
定理 9: \(\mathbb{C}^n\) 上每一个范数与 \(M_n\) 上一个非矩阵范数的向量范数相容.
应该知道什么
- \(M_n\) 上有许多并非矩阵范数的范数,但是 \(M_n\) 上每一个范数都与任何一个矩阵范数等价