正定矩阵(用于SVM的Mercer定理)

定义:一个n × n的实对称矩阵 M正定当且仅当对于所有的非零实系数向量z,都有 zTMz > 0。

正定矩阵判定

1. 矩阵M的所有的特征值 λi都是正的。根据谱定理M必然与一个实对角矩阵D相似(也就是说M = P − 1DP,其中P幺正矩阵,或者说M在某
正交基可以表示为一个实对角矩阵)。因此,M是正定阵当且仅当相应的D的对角线上元素都是正数。
2. 半双线性形式
\langle \textbf{x},\textbf{y}\rangle = \textbf{x}^{*} M \textbf{y}

定义了一个Cn上的内积。实际上,所有Cn上的内积都可看做由某个正定阵通过此种方式得到。

3. Mn个线性无关的n维向量\textbf{x}_1,\ldots,\textbf{x}_n \in \mathbb{C}^kGram矩阵,其中的k为某个正整数。更精确地说,M定义为:
M_{ij} = \langle \textbf{x}_i, \textbf{x}_j\rangle = \textbf{x}_i^{*} \textbf{x}_j.

换句话说,M具有A*A的形式,其中A不一定是方阵,但需要是单射的。

4. M的所有顺序主子式,也就是顺序主子阵行列式都是正的(西尔维斯特准则)。明确来说,就是考察下列矩阵的行列式:
  • M左上角1× 1的矩阵
  • M左上角2× 2矩阵
  • ...
  • M自身。

对于半正定矩阵来说,相应的条件应改为所有的主子式非负。顺序主子式非负并不能推出矩阵是半正定的。比如以下例子:

\begin{bmatrix} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 0 \end{bmatrix}
5. 存在唯一的下三角矩阵 L,其主对角线上的元素全是正的,使得:
M = LL * .

其中L *L共轭转置。 T这一分解被称为Cholesky分解

正定矩阵性质:

M为半正定阵,可以写作M \geq 0 。如果M是正定阵,可以写作M > 0。这个记法来自泛函分析,其中的正定阵定义了正算子

对于一般的埃尔米特矩阵,MNM\geq N 当且仅当M-N \geq 0 。这样可以定义一个在埃尔米特矩阵集合上的偏序关系。类似地,可以定义 M > N

1.

每个正定阵都是可逆的,它的逆也是正定阵。如果 M \geq N > 0 那么 N^{-1} \geq M^{-1} > 0

2. 如果M是正定阵,r > 0为正实数,那么 rM 也是正定阵。

如果 MN 是正定阵,那么和M + N、乘积 MNMNMN 都是正定的。如果 MN = NM,那么 MN 仍是正定阵。

3. 如果M = (mij) > 0 那么主对角线上的系数mii 为正实数。于是有tr(M) > 0。此外还有
| m_{ij} | \leq \sqrt{m_{ii} m_{jj}} \leq \frac{m_{ii}+m_{jj}}{2}.
4. 矩阵M 是正定阵当且仅当存在唯一的正定阵B > 0 使得 B2 = M。根据其唯一性可以记作B = M1 / 2,称BM 的平方根。对半正定阵也有类似结论。同时,如果M > N > 0 那么 M1 / 2 > N1 / 2 > 0.
5. 如果M,N > 0 那么 M\otimes N > 0 ,其中 \otimes 表示克罗内克乘积
6. 对矩阵M = (mij),N = (nij),将两者同一位置上的系数相乘所得的矩阵记为M\circ N ,即M\circ N_{i,j}=m_{ij} n_{ij} ,称为MN阿达马乘积。如果M,N > 0,那么 M\circ N > 0 。如果 M,N实系数矩阵,则有如下不等式成立:

\det(M\circ N) \geq (\det N) \prod_{i} m_{ii}.

7. M > 0N 为埃尔米特矩阵。如果MN+NM \geq 0 MN + NM > 0),那么N\geq 0 N > 0)。
8. 如果M,N\geq 0为实系数矩阵,则\text{tr}(MN)\geq 0
9. 如果M > 0为实系数矩阵,那么存在δ > 0 使得M\geq \delta I,其中 I单位矩阵

posted @ 2009-03-31 22:46  macula7  阅读(897)  评论(0编辑  收藏  举报