二次型和矩阵合同
1. 二次型
含有 $n$ 个变量 $x_{1},x_{2},...,x_{n}$ 的二次齐次函数 $f(x_{1},x_{2},...,x_{n})$ 称为 $n$ 元二次型,即在一个多项式中,未知数的
个数为任意多个,但每一项的次数都为 $2$ 的多项式,如
$$f(x) = ax^{2} \\
f(x,y) = ax^{2} + by^{2} + cxy \\
f(x,y,z) = ax^{2} + by^{2} + cz^{2} + dxy + exz + fyz$$
它起源于几何学中二次曲线方程和二次曲面方程化为标准形问题的研究。
二次型中每一项都是二次的,没有一次项和常数项,之所以不研究包含一次项和常数项的二次非齐次多项式,是由于:
一次项与常数项的改变不会影响函数图像的大致形状。
一个二次型可以用一个矩阵表示成如下的形式:
$$f(x) = x^{T}Ax$$
其中 $x$ 是自变量组成的列向量。
一定都会找到一个对称的矩阵 $A$ 来表示表示这个二次型,假如 $A$ 不对称,那么必然有对称矩阵 $B = (A + A^{T}) / 2$ 满足
$$x^{T}Ax = x^{T}Bx$$
因为实对称矩阵具有许多特别的性质,为了方便研究,规定二次型矩阵就是一个实对称矩阵。
更为关键的是:如果二次型矩阵是对称的,那么它将是唯一的。
二次型的图形:为了方便研究二次型,我们代入具体的函数值,研究一个具体的图形:
$$x^{T}Ax = C$$
这样就表示成一个曲线或者曲面,这个图形由取具体函数值的自变量全体构成的。描述它的参考系(少了函数值那个维度)不同,
二次型矩阵也不同,这涉及到合同的概念。
2. 矩阵合同
在线性代数,特别是二次型理论中,常常用到矩阵间的合同关系。
定义:设 $A$ 和 $B$ 是两个 $n$ 阶方阵,若存在可逆矩阵 $C$,使得
$$C^{T}AC = B$$
则方阵 $A$ 与 $B$ 合同,$A$ 到 $B$ 的变换 $C$ 称为合同变换。
那矩阵 $A$ 和 $B$ 合同到底有什么意义呢?我们已经知道相似是相同的线性变换在不同基下的表示,那合同呢?
下面针对一个二次型的图形来表述,即代入具体函数值之后的曲线或曲面。
合同矩阵不是一种变换,它代表着一个二次型的图形,同一个图形在不同的参考系下位置不同,意味着描述它的矩阵不同。
注意:这个参考系是描述自变量的,比如函数 $f(x,y)$,那么参考系就是 $x$ 轴和 $y$ 轴 $2$ 个维度,选择不同的基构成它们,二次型矩阵也不同。
举一个例子,下面是两个不同的参考系描述同一个图形,
虽然在不同的参考系下得到的多项式或二次型矩阵不同,但我们得知道它们是不是同一个图形,于是有合同的概念。
两个合同的矩阵是:同一个图形在不同基下的表示。
那怎么判断两个矩阵合同呢?
证明:
选定两组基,矩阵 $C$ 是两个基之间的过渡矩阵,设 $x,y$ 是图形上同一个点在两个参考系中的坐标表示,即它们对应的函数值相同,则有
$$x = Cy$$
于是有
$$x^{T}Ax = (Cy)^{T}B(Cy) = y^{T}C^{T}BCy$$
所以
$$A = C^{T}BC$$
证毕
-------------------------------------------------------------------分割线-----------------------------------------------------------------------
二次型的标准型:经过一个可逆线性变换,即过渡矩阵 $C$ 的作用,原二次型矩阵 $A$ 变成一个对角阵,即二次型函数变成
$$f(y) = d_{1}y_{1}^{2} + d_{2}y_{2}^{2} + ... + d_{n}y_{n}^{2}$$
我们知道两个矩阵合同是二次型图形在不同基下的不同表示,那合同于一个对角阵意味着什么呢?
先来观察一下这个函数,可以直观地看出,它是一个偶函数,关于各个坐标轴对称,故在这个参考系下,这个二次型的图形是“正”着的。
一个二次型的标准型并不唯一,单位长度发生变化,或者每个基向量的单位长度不相同,对于同一个图形,它们的标准型便不同。
那如何将一个二次型变成标准型呢?
根据实对称矩阵的特点,我们知道一个 $n$ 阶的二次型矩阵存在 $n$ 个线性无关且正交的特征向量,于是存在一个正交矩阵 $C$ 使它
相似于一个对角阵,即
$$C^{-1}AC = \Lambda$$
由正交矩阵的性质知
$$C^{-1} = C^{T}$$
所以有
$$C^{T}AC = \Lambda$$
所以只要求出二次型矩阵的 $n$ 个正交的特征向量,那它们构成的矩阵即为产生标准型的一种线性变换,为什么说是一种呢?
因为变成标准型的线性变换并不唯一,标准型也不唯一。
二次型标准型的平方项系数不一定就是特征值,要看标准型是通过什么转换完成的。如果是正交变换,那变换出来的系数是特征值。
如果是配方法,那系数就不是特征值。配方法得出的标准型和正交法标准型有同样的规范型。
任意一个线性变换矩阵都可以得到一个合同矩阵,存在一个与之对应的参考系。
--------------------------------------------------------------------分割线----------------------------------------------------------------------
二次型的规范型:一个对称矩阵的规范型是指与它合同的最简对角阵,对角线上的元素只可能有 $1,-1,0$ 且按 $1,...,1,-1,...,-1,0,...,0$ 排列。
正惯性指数:系数为正的平方项的个数为二次型的正惯性指数。
对于两个二次型矩阵:合同 $\Leftrightarrow$ 有相同的正负惯性指数。
一个二次型矩阵可以合同于一个规范型,即合同于一个对角线上只有 $\pm 1$ 以及 $0$ 的对角矩阵。
下面我们来做一个证明:
由于一个二次型肯定可以合同于一个对角阵,所以我们只需要证明:一个任意的对角阵合同于一个对角线上只有 $\pm 1$ 以及 $0$ 的对角矩阵。
随便设一个矩阵
$$C = \begin{bmatrix}
a & & \\
& b & \\
& & 0
\end{bmatrix}$$
设矩阵 $P$ 为
$$\begin{bmatrix}
\frac{1}{\sqrt{|a|}} & & \\
& \frac{1}{\sqrt{|b|}} & \\
& & 0
\end{bmatrix}$$
于是有
$$P^{T}CP = \begin{bmatrix}
\frac{1}{\sqrt{|a|}} & & \\
& \frac{1}{\sqrt{|b|}} & \\
& & 0
\end{bmatrix}
\begin{bmatrix}
a & & \\
& b & \\
& & 0
\end{bmatrix}
\begin{bmatrix}
\frac{1}{\sqrt{|a|}} & & \\
& \frac{1}{\sqrt{|b|}} & \\
& & 0
\end{bmatrix} =
\begin{bmatrix}
\frac{a}{\sqrt{|a|}} & & \\
& \frac{b}{\sqrt{|b|}} & \\
& & 0
\end{bmatrix}
\begin{bmatrix}
\frac{1}{\sqrt{|a|}} & & \\
& \frac{1}{\sqrt{|b|}} & \\
& & 0
\end{bmatrix} =
\begin{bmatrix}
\frac{a}{|a|} & & \\
& \frac{b}{|b|} & \\
& & 0
\end{bmatrix}$$
按这种方式构造矩阵,所有对角阵都会合同于一个由 $\pm 1$ 以及 $0$ 组成的对角阵,而 $\pm 1$ 的个数取决于原矩阵的正负惯性指数。
根据合同的传递性,只要二次型矩阵有相同的正负惯性指数,则它们就会合同。
那将一个二次型矩阵变成规范性,变换后的参考系长啥样呢?
来看一个例子,假如原先的参考系为标准正交基,即笛卡尔坐标系,对于椭圆
$$\frac{x^{2}}{16} + \frac{y^{2}}{9} = 1$$
它的二次型矩阵为
$$A = \begin{bmatrix}
\frac{1}{16} & \\
& \frac{1}{9}
\end{bmatrix}$$
图形如下
已经是一个对角阵,现在我们将它变成规范型,做变换
$$B = \begin{bmatrix}
4 & \\
& 3
\end{bmatrix}
\begin{bmatrix}
\frac{1}{16} & \\
& \frac{1}{9}
\end{bmatrix}
\begin{bmatrix}
4 & \\
& 3
\end{bmatrix} =
\begin{bmatrix}
1 & \\
& 1
\end{bmatrix}$$
对应的二次型为
$$x^{2} + y^{2} = 1$$
怎么似乎把它变成了一个圆?其实不是,合同变换不会改变图形的形状,只是参考系变了,通过过渡矩阵
$$P =
\begin{bmatrix}
4 & \\
& 3
\end{bmatrix}$$
参考系变化情况如下图
在这个参考系中,$x$ 轴和 $y$ 轴的单位长度是不等长的。
--------------------------------------------------------------------分割线----------------------------------------------------------------------
正定二次型:对任意的非零向量,恒有 $f(x) = x^{T}Ax > 0$,则称 $f$ 正定或矩阵 $A$ 正定。
直观上,只要自变量不是原点,即不是全 $0$,那么函数的图像就在正半轴上。
$n$ 阶实对称矩阵 $A$ 正定
$\Leftrightarrow$ $A$ 的正惯性指数等于 $n$
$\Leftrightarrow$ $A$ 与单位阵合同
$\Leftrightarrow$ $A$ 的特征值全部大于 $0$
这上面 $3$ 点很容易理解,因为任何一个二次型矩阵都可以通过正交变换合同于一个对角阵,如果特征值存在 $0$ 或者负值,如
$$f(x) = \lambda_{1}x_{1}^{2} + \lambda_{2}x_{2}^{2} + ... + \lambda_{n}x_{n}^{2}$$
设 $\lambda_{1} < 0$,那么必定存在非 $0$ 向量 $x = (1,0,0,...,0)$ 使函数值为负值。
$\Leftrightarrow$ $A$ 的顺序主子式大于 $0$
1)先证明:正定 $\Rightarrow$ 顺序主子式大于 $0$
设二次型
$$f(x_{1},x_{2},...,x_{n}) = \sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_{i}x_{j}$$
我们的目的是证明左上角的任意一个 $k$ 阶子矩阵的行列式 $>$ 0,这个子矩阵本身也构成一个 $k$ 元二次型,即
$$f(x_{1},x_{2},...x_{k},0,...,0) = \sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_{i}x_{j}$$
由于原二次型正定,这样取向量后,这个 $k$ 元二次型也得是正定的,故其特征值全部大于 $0$,即行列式大于 $0$。
2)再证明:顺序主子式大于 $0$ $\Rightarrow$ 正定
采用数学归纳法,当 $n = 1$ 时,
$$f(x_{1}) = a_{11}x^{2}$$
由于 $a_{11} > 0$,故 $f(x_{1})$ 正定。
假设对于 $n-1$ 阶矩阵,其顺序主子式大于 $0$ 推出正定成立,现在来证明 $n$ 元的情形。
设 $\alpha$ 为列向量,将矩阵 $A$ 分块写成
$$A = \begin{bmatrix}
A_{n-1} & \alpha \\
\alpha^{T} & b
\end{bmatrix}$$
其中 $A$ 和 $A_{1}$ 的顺序主子式全都大于 $0$。
由假设知 $A_{1}$ 是正定矩阵,即存在可逆的 $n-1$ 阶矩阵 $G$,使
$$G^{T}A_{1}G = E_{n-1}$$
即矩阵 $A_{1}$ 合同于一个单位阵,构造一个矩阵 $C_{1}$,
$$C_{1} = \begin{bmatrix}
G & 0\\
0 & 1
\end{bmatrix}$$
于是有
$$C_{1}^{T}AC_{1} = \begin{bmatrix}
G^{T} & 0\\
0 & 1
\end{bmatrix}
\begin{bmatrix}
A_{n-1} & \alpha \\
\alpha^{T} & b
\end{bmatrix}
\begin{bmatrix}
G & 0\\
0 & 1
\end{bmatrix} =
\begin{bmatrix}
E_{n-1} & G^{T}\alpha \\
\alpha^{T}G & b
\end{bmatrix}$$
再构造一个矩阵 $C_{2}$,
$$C_{2} = \begin{bmatrix}
E_{n-1} & -G^{T}\alpha \\
0 & 1
\end{bmatrix}$$
于是有
$$C_{2}^{T}C_{1}^{T}AC_{1}C_{2} =
\begin{bmatrix}
E_{n-1} & 0 \\
-\alpha^{T}G & 1
\end{bmatrix}
\begin{bmatrix}
E_{n-1} & G^{T}\alpha \\
\alpha^{T}G & b
\end{bmatrix}
\begin{bmatrix}
E_{n-1} & -G^{T}\alpha \\
0 & 1
\end{bmatrix} =
\begin{bmatrix}
E_{n-1} & 0 \\
0 & b - \alpha^{T}GG^{T}\alpha
\end{bmatrix}$$
由于 $|A| > 0$,故 $b - \alpha^{T}GG^{T}\alpha > 0$,所以正惯性指数为 $n$。