高等代数5 二次型

高等代数 5 二次型

二次型

二次型及其矩阵表示

  • \(P\)是一数域,一个系数在数域\(P\)中的\(x_1,x_2,\cdots,x_n\)的二次齐次多项式

\[f(x_1,x_2,\cdots,x_n)= a_{11}x_1^2+2a_{12}x_1x_2+\cdots+2a_{1n}x_1x_n\\ +a_{22}x_2^2+\cdots+2a_{2n}x_2x_n+\cdots \\ +a_{nn}x_n^2 \]

称为数域\(P\)上一个\(n\)元二次型,或简称为二次型

  • 把(1)的系数排成一个\(n \times n\)矩阵

\[A= \left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right ) \]

它就称为二次型(1)的矩阵

​ 因为\(a_{ij}=a_{ji},i,j=1,\cdots,n\),所以,\(A'=A\)。因此二次型的矩阵都是对称的

  • \[X=\left ( \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{matrix} \right ) \]

    于是二次型可以用矩阵的乘积表示出来

    \[X'AX=(x_1,x_2,\cdots,x_n)\left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right )\left ( \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{matrix} \right )=f(x_1,x_2,\cdots,x_n) \]

二次型和它的矩阵是相互唯一决定的

线性替换及其矩阵表示

  • 线性替换\(x_1,\cdots,x_n;y_1,\cdots,y_n\)是两组文字,系数在数域\(P\)中的一组关系式

    \[\begin{cases} x_1=c_{11}y_1 +c_{12}y_2+\cdots +c_{1n}y_n \\ x_2=c_{21}y_1 +c_{22}y_2+\cdots +c_{2n}y_n\\ \ \ \ \cdots \cdots \\ x_n=c_{n1}y_1 +c_{n2}y_2+\cdots +c_{nn}y_n \\ \end{cases} \]

    称为由\(x_1,\cdots,x_n\)\(y_1,\cdots,y_n\)的一个线性替换

    如果系数行列式\(|c_{ij}|\neq 0\),那么线性替换(5)就称为非退化的

    线性替换把二次型变成二次型。

  • \[C=\left ( \begin{matrix} c_{11} & c_{12} & \cdots & c_{1n} \\ c_{21} & c_{22} & \cdots & c_{2n} \\ \vdots & \vdots & & \vdots \\ c_{n1} & c_{n2} & \cdots & c_{nn} \\ \end{matrix} \right ), Y= \left ( \begin{matrix} y_1 \\ y_2 \\ \vdots \\ y_n \\ \end{matrix} \right ) \]

    线性替换可以写成

    \[\left ( \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{matrix} \right ) = \left ( \begin{matrix} c_{11} & c_{12} & \cdots & c_{1n} \\ c_{21} & c_{22} & \cdots & c_{2n} \\ \vdots & \vdots & & \vdots \\ c_{n1} & c_{n2} & \cdots & c_{nn} \\ \end{matrix} \right ) \left ( \begin{matrix} y_1 \\ y_2 \\ \vdots \\ y_n \\ \end{matrix} \right ) \]

    或者 \(X=CY\)

  • 替换后的二次型的矩阵与原二次型的矩阵之间的关系

    \[f(x_1,x_2,\cdots,x_n)=X'AX=(CY)'A(CY)=Y'(C'AC)Y=Y'BY \]

    因此 \(B=C'AC\)

合同变换

  • 定义 数域\(P\)\(n \times n\)矩阵\(A,B\)称为合同的,如果有数域\(P\)上可逆的\(n \times n\)矩阵\(C\),使 \(B=C'AC\)

    合同是矩阵之间的一个关系。合同关系具有

    1. 自反性 \(A=E'AE\)
    2. 对称性 由 \(B=C'AC\)可以得到\(A=(C^{-1})'BC^{-1}\)
    3. 传递性 由\(A_1=C_1'AC_1,A_2=C_2’AC_2\)即得\(A_2=(C_1C_2)'A(C_1C_2)\)

    因此,经过非退化的线性替换,新的二次型的矩阵与二次型的矩阵是合同的

标准形

  • 数域\(P\)上任意一个二次型都可以经过非退化的线性替换变为平方和\(d_1x_1^2+d_2x_2^2+\cdots+d_nx_n^2\)的形式.

二次型\(f(x_1,x_2,\cdots,x_n)\)经过非退化线性替换所变成的平方和称为\(f(x_1,x_2,\cdots,x_n)\)的一个标准形

对应的矩阵是对角矩阵

\[d_1x_1^2+d_2x_2^2+\cdots+d_nx_n^2\\ = (x_1,x_2,\cdots,x_n)\left ( \begin{matrix} d_1 & 0 & \cdots & 0 \\ 0 & d_2 & \cdots & 0 \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & d_n \\ \end{matrix} \right )\left ( \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{matrix} \right ) \]

  • 在数域\(P\)上,任意一个对称矩阵都合同于一对角矩阵。

  • 在一个二次型的标准形中,系数不为零的平方项的个数是唯一确定的,与所做的非退化线性替换无关,二次型矩阵的秩有时就称为二次型的秩

  • 在一般的数域中,二次型的标准形不是唯一的而与所作的非退化的线性替换有关。

  • 配方法

    • \(a_{ii}(i=1,2,\cdots,n)\)中至少有一个不为零,不妨设\(a_{11}\neq 0\),这时

      \[f(x_1,x_2,\cdots,x_n)=a_{11}x_1^2+\sum_{j=2}^n{a_{1j}x_1x_j}+\sum_{i=2}^n{a_{i1}x_ix_1}+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \\ =a_{11}x_1^2+2\sum_{j=2}^n{a_{1j}x_1x_j}+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \ (合并x_1出现的交叉项)\\ =a_{11}(x_1+\sum_{j=2}^n{a_{11}^{-1}a_{1j}x_j})^2-a_{11}^{-1}(\sum_{j=2}^n{a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \ (把x_1凑成平方和) \\ =a_{11}(x_1+\sum_{j=2}^n{a_{11}^{-1}a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}x_ix_j} \\ 这里\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}x_ix_j}=-a_{11}^{-1}(\sum_{j=2}^n{a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j}是一个x_2,x_3,\cdots,x_n的二次型 \]

      \[\begin{cases} y_1=x_1+\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}x_j} \\ y_2=x_2\\ \ \ \ \cdots \cdots \\ y_n=x_n \\ \end{cases} \]

      \[\begin{cases} x_1=y_1-\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}y_j} \\ x_2=y_2\\ \ \ \ \cdots \cdots \\ x_n=y_n \\ \end{cases} \]

      这是一个非退化线性替换,它使

      \[f(x_1,x_2,\cdots,x_n)=a_{11}y_1^2+\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}y_iy_j} \]

  • 所有\(a_{ii}=0\),但至少有一\(a_{qj}\neq 0(j>1)\),不妨设\(a_{12}\neq 0\)

    \[ \begin{cases} x_1=z_1+z_2 \\ x_2=z_1-z_2\\ x_3=z_3\\ \ \ \ \cdots \cdots \\ x_n=z_n \\ \end{cases} \]

    它是非线性替换,且使

    \[ f(x_1,x_2,\cdots,x_n)=2a_{12}x_1x_2+\cdots \\ =2a_{12}(z_1+z_2)(z_1-z_2)+\cdots \\ =2a_{12}z_1^2-2a_{12}z_2^2 \]

    这时上式右端是\(z_1,z_2,\cdots,z_n\)的二次型,且\(z_1^2\)的系数不为零。

  • 合同变换法

    • \(a_{11}\neq 0\).这时的变数替换为

      \[\begin{cases} x_1=y_1-\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}y_j} \\ x_2=y_2\\ \ \ \ \cdots \cdots \\ x_n=y_n \\ \end{cases} \]

      \[C_1= \left ( \begin{matrix} 1 & -a_{11}^{-1}a_{12} & \cdots & -a_{11}^{-1}a_{1n} \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & 1 \\ \end{matrix} \right ) \]

      则上述变数替换相应于合同变换

      \[A \rightarrow C_1^{'}AC_1= \left ( \begin{matrix} a_{11} & O \\ O &A_1-a_{11}^{-1}a'a\\ \end{matrix} \right )\\ 这里 a=(a_{12},\cdots,a_{1n}),A_1=\left ( \begin{matrix} a_{22} & \cdots & a_{2n} \\ \vdots & & \vdots \\ a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right ) \]

    • \(a_{ii}=0,i=1,\cdots,n\)但有一\(a_{ij}\neq0,j\neq1\)

      作合同变换\(P(2,j)'AP(2,j)\) 可以把\(a_{1j}\)搬到第一行第二列的位置,这样就变成了配方法中第二种情况。

      与第二种情形的变数替换相对应,取

      \[C_1= \left ( \begin{matrix} 1 & 1 &0& \cdots & 0 \\ 1 & -1 &0& \cdots & 0 \\ 1 & 1 &1& \cdots & 0 \\ \vdots & \vdots & \vdots& \cdots & 0 \\ 0 & 0 &0& \cdots & 1 \end{matrix} \right ) \]

      于是\(C_1'AC_1\)的左上角就是

      \[\left ( \begin{matrix} a_{12} & 0 \\ 0 & -2a_{12} \\ \end{matrix} \right ) \]

      可以归结到第一种情形

规范形

  • 复二次型的规范形

    \(f(x_1,x_2,\cdots,x_n)\)是一个复系数的二次型,经过一系列适当的非退化线性替换后,\(f(x_1,x_2,\cdots,x_n)\)变成标准形。

    不妨假定它的标准形是\(d_1y_1^2+d_2y_2^2+\cdots+d_ry_r^2,d_i\neq 0,i=1,2,\cdots,r\),易知\(r\)就是\(f(x_1,x_2,\cdots,x_n)\)的秩。

    因为复数总是可以开平方的,我们再做一个非退化的线性替换

    \[\begin{cases} y_1=\frac{1}{\sqrt{d_1}}z_1 \\ \ \ \ \cdots \cdots \\ y_r=\frac{1}{\sqrt{d_r}}z_r\\ \ \ \ \cdots \cdots \\ y_{r+1}=z_{r+1}\\ \ \ \ \cdots \cdots \\ y_n=z_n \\ \end{cases} \]

    就变成

    \[z_1^2+z_2^2+\cdots+z_r^2 \]

    上式称为复二次型的规范形

  • 定理 任意一个复系数的二次型,经过一个适当的非退化线性替换可以变成规范形,并且规范形是唯一的

  • 定理 任一复数的对称矩阵都合同于一个形式为

    \[\left ( \begin{matrix} 1 & & & & & &\\ &\ddots & & & & & \\ & & 1 & & & & \\ & & & 0& & & \\ & & & &\ddots & & \\ & & & & & & 0 \\ \end{matrix} \right ) \]

    的对角矩阵,其中对角线上1的个数\(r\)等于\(A\)的秩。

    两个复数对称矩阵合同的充分必要条件是它们的秩相等。

  • 实二次型的规范形

    \(f(x_1,x_2,\cdots,x_n)\)是一个实系数的二次型,经过一系列适当的非退化线性替换后,再适当排列文字的次序,可使\(f(x_1,x_2,\cdots,x_n)\)变成标准形

    \[d_1y_1^2+\cdots+d_py_p^2-d_{p+1}y_{p+1}^2-\cdots-d_ry_r^2,d_i>0,i=1,\cdots,r;r是二次型的秩 \]

    因为在实数域中,正实数总是可以开平方的,我们再做一个非退化的线性替换

\[\begin{cases} y_1=\frac{1}{\sqrt{d_1}}z_1 \\ \ \ \ \cdots \cdots \\ y_r=\frac{1}{\sqrt{d_r}}z_r\\ y_{r+1}=z_{r+1}\\ \ \ \ \cdots \cdots \\ y_n=z_n \\ \end{cases} \]

​ 就变成

\[z_1^2+\cdots+z_p^2-z_{p+1}^2-\cdots-z_{r}^2 \]

​ 上式称为实二次型的规范形,显然,规范形完全被\(r,p\)这两个数所决定。

  • 定理 任意一个实系数的二次型,经过一个适当的非退化线性替换可以变成规范形,并且规范形是唯一的。

  • 任一复数的对称矩阵都合同于一个形式为

    \[\left ( \begin{matrix} 1 & & & & & &\\ &\ddots & & & & & \\ & & 1 & & & & \\ & & & -1& & & \\ & & & &\ddots & & \\ & & & & & & -1 \\ & & & & & & &0 \\ & & & & & & & &\ddots \\ & & & & & & & & &0 \\ \end{matrix} \right ) \]

    的对角矩阵,其中对角线上1的个数\(p\)及-1的个数\(r-p\)\(r\)是矩阵\(A\)的秩)都是唯一确定的,分别称为\(A\)正、负惯性指数,它们的差\(2p-r\)称为\(A\)符号差

    两个复数对称矩阵合同的充分必要条件是它们的秩相等。

正定二次型

正定二次型

  • 定义 正定二次型 实二次型\(f(x_1,x_2,\cdots,x_n)\)称为正定的,如果对于任意一组不全为零的实数\(c_1,c_2,\cdots,c_n\)都有\(f(c_1,c_2,\cdots,c_n)\)>0。
  • 定理 \(n\)元实二次型\(f(x_1,x_2,\cdots,x_n)\)是正定的的充分必要条件是它的正惯性指数等于\(n\)

正定矩阵

  • 定义 正定矩阵 实对称矩阵\(A\)称为正定的,如果二次型\(X'AX\)正定。
  • 一个实对称矩阵是正定的当且仅当它与单位矩阵合同。
    • 正定矩阵的行列式大于零。

顺序主子式

  • 定义 顺序主子式

    子式

    \[H_i=\left | \begin{matrix} a_{11} & a_{12} & \cdots & a_{1i} \\ a_{21} & a_{22} & \cdots & a_{2i} \\ \vdots & \vdots & & \vdots \\ a_{i1} & a_{i2} & \cdots & a_{ii} \\ \end{matrix} \right | (i=1,2,\cdots,n) \]

    称为矩阵\(A=(a_{ij})_{nn}\)的顺序主子式。

  • 定理 实二次型

    \[f(x_1,x_2,\cdots,x_n)=\sum_{i=1}^n\sum_{j=1}^n{a_{ij}x_ix_j}=X'AX \]

    是正定的充分必要条件为矩阵\(A\)的顺序主子式全大于零。

  • 定义 设\(f(x_1,x_2,\cdots,x_n)\)是一实二次型,对于任意一组不全为零的实数\(c_1,c_2,\cdots,c_n\)

    • 如果都有\(f(c_1,c_2,\cdots,c_n)<0\),那么\(f(x_1,x_2,\cdots,x_n)\) 称为负定的
    • 如果都有\(f(c_1,c_2,\cdots,c_n)\geq0\),那么\(f(x_1,x_2,\cdots,x_n)\) 称为半正定的
    • 如果都有\(f(c_1,c_2,\cdots,c_n)\leq0\),那么\(f(x_1,x_2,\cdots,x_n)\) 称为半负定的
    • 如果它既不是半正定又不是半负定,那么\(f(x_1,x_2,\cdots,x_n)\) 称为不定的

半正定性

  • 定理 对于实二次型\(f(x_1,x_2,\cdots,x_n)=X'AX\),其中\(A\)是实对称的,下列条件等价:

    1. \(f(x_1,x_2,\cdots,x_n)\)是半正定的;

    2. 它的正惯性指数和秩相同;

    3. 有可逆实矩阵\(C\),使

      \[C'AC= \left ( \begin{matrix} d_1 & & \\ &d_2 & & \\ & &\ddots & \\ & & & d_n \\ \end{matrix} \right ) ,d_i\geq0.i=1,2,\cdots,n; \]

    4. 有实矩阵\(C\)使 \(A=C'C\)

    5. \(A\)的所有主子式(行指标与列指标相同的子式)皆大于或等于零。

posted @ 2020-08-28 21:54  英飞  阅读(1182)  评论(0编辑  收藏  举报