高等代数1 矩阵
高等代数1 矩阵
矩阵的基本运算
矩阵概念
由\(sn\)个数排成的\(s\)行(横的)\(n\)列(纵的)表
称为一个\(s \times n\)矩阵。
相等
只有完全一样的矩阵才相等。
加法
为了确定起见,我们取定一个数域\(P\),以下讨论的矩阵全是由数域\(P\)中的数组成的。
矩阵的加法就是矩阵对应的元素相加。相加的矩阵必须有相同的行数和列数。
矩阵的加法归结为他们的元素的加法。
结合律
\(A+(B+C)=(A+B)+C\)
交换律
\(A+B=B+A\)
零矩阵
元素全为零的矩阵称为零矩阵,记为\(O\)。
显然有,\(A+O=A\)
减法
负矩阵
矩阵\(A\)的负矩阵记为\(-A\), 有\(A+(-A)=O\)
减法:\(A-B=A+(-B)\)
转置
把一矩阵\(A\)的行列互换,得到的矩阵称为\(A\)的转置,记为\(A'(A^T)\)。
转置有以下规律
共轭矩阵
当\(A=(a_{ij})\)为复矩阵时,用\(\bar{a}\)表示\(a\)的共轭复数,记\(\bar{A}=(\bar{a_{ji}})\),即把矩阵转置后在把每个数换成它的共轭复数。\(\bar{A}\)为\(A\)的共轭矩阵。
Hermite矩阵(自共轭矩阵)
其相对于主对角线以复共轭方式对称。
显然,Hermite阵主对角线上的元素必须是实数。对于只包含实数元素的矩阵(实矩阵),如果它是对称阵,即所有元素关于主对角线对称,那么它也是Hermite阵。也就是说,实对称阵是Hermite阵的特例
数量乘法
用数\(k\)乘矩阵就是把矩阵的每一个元素都乘以\(k\)。
矩阵的数量乘积有以下规律
数量矩阵
矩阵\(kE\)称为数量矩阵。
如果\(A\)是一个\(n\times n\)的矩阵,那么有 \(kA=(kE)A=A(kE)\),这个式子说明数量矩阵与所有的\(n \times n\)矩阵作乘法是可交换的。
可以证明,如果\(A\)与所有的\(n\)级矩阵可交换,那么\(A\)一定是数量矩阵,即\(A=aE\)。
对称矩阵、反称矩阵
对称矩阵: 如果\(A'=A\),矩阵\(A\)称为对称的。
反称矩阵:如果\(A'=-A\),矩阵\(A\)称为反称的。
任一\(n\times n\)矩阵都可以表示为一对称矩阵和一反称矩阵之和。
矩阵相乘
设 \(A=(a_{ik})_{sn},B=(b_{kj})_{nm}\),那么矩阵\(C=(c_{ij})_{sm}\),其中\(c_{ij}=a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots++a_{in}b_{nj}= \sum_{k=1}^{n}a_{ik}b_{kj}\)
称为\(A\)与\(B\)的乘积,记为\(C=AB\)。
矩阵\(A,B\)乘积\(C\)的第\(i\)行第\(j\)列的元素等于第一个矩阵\(A\)的第\(i\)行与第二个矩阵\(B\)的第\(j\)列的对应元素乘积的和。
当然在矩阵乘积定义中我们要求第二个矩阵的行数和第一个矩阵的列数相等。
单位矩阵
主对角线上的元素都是\(1\),其余元素都是\(0\)的\(n\times n\)矩阵称为\(n\)级单位矩阵,记作\(E_n\),或简单记为\(E\)
显然有
\(A_{sn}E_{n}=A_{sn}\)
\(E_{n}A_{sn}=A_{sn}\)
结合律
设\(A=(a_{ij})_{sn},B=(b_{jk})_{nm},C=(c_{kl})_{mr}\)
\((AB)C=A(BC)\)
不适合交换律
矩阵的乘法不适合交换律,即一般来说\(AB\neq BA\).
两个不为零的矩阵的乘积可以是零。
矩阵乘法的消去律不成立。
可交换矩阵
如果\(AB=BA\),矩阵\(B\)就称为与\(A\)可交换。
乘法和加法的分配律
矩阵的方幂
方幂只能对行数和列数相等的矩阵定义
设\(A\)是一\(n\times n\)矩阵,定义\(A^1=A,A^{k+1}=A^k A\),话句话说\(A^k\)就是\(k\)个\(A\)相乘。
由乘法的结合律有,\(A^k A^l=A^{k+l} \\ (A^k)^l=A^{kl}\)
矩阵的逆
\(n\)级方阵\(A\)称为可逆的,如果有\(n\)级矩方阵\(B\),使得
这里的\(E\)指的是单位矩阵。
-
由于矩阵的乘法规则,只有方阵才能满足(4)
-
对于任意矩阵\(A\),适合等式(4)的矩阵\(B\)是唯一的(如果有的话)。
如果矩阵\(B\)适合(4),那么\(B\)就称为\(A\)的逆矩阵,记作\(A^{-1}\).
对于\(n\)级方阵\(A,B\),如果\(AB=E\),那么\(A,B\)就都是可逆的并且它们互为逆矩阵。
矩阵可逆条件
- 伴随矩阵
设矩阵\(A_{ij}\)是矩阵
中元素\(a_{ij}\)的代数余子式,矩阵
称为\(A\)的伴随矩阵。‘
由行列式按一行(列)展开的公式立即得出
如果\(d=|A| \neq 0\),那么由(7)得
- 定理
矩阵\(A\)是可逆的充分必要条件是\(A\)非退化,而\(A^{-1}=\frac{1}{d} A^{*} (d=|A|\neq 0)\)。
推论
如果矩阵\(A、B\)可逆,那么\(A'\)与\(AB\)也可逆,且
$(A'){-1}=(A)' \(AB){-1}=BA^{-1} $
矩阵初等变换
初等行变换
数域\(P\)上矩阵的初等行变换是指下面三种变换:
-
以\(P\)中一个非零的数乘矩阵的某一行;
-
把矩阵的某一行的\(c\)倍加到另一行,这里的\(c\)是\(P\)中任意一个数;
-
互换矩阵中两行的位置。
任意一个矩阵经过一系列初等行变换总能变成阶梯形矩阵
初等列变换
- 以数域\(P\)中一非零数乘矩阵的某一列;
- 把矩阵的某一列的\(c\)倍加到另一列,这里\(c\)是数域\(P\)中任意一个数;
- 互换矩阵两列的位置。
初等变换
矩阵的初等行变换与列变换统称为初等变换。
初等矩阵
由单位矩阵\(E\)经过一次初等变换得到的矩阵称为初等矩阵。
显然初等矩阵都是方阵。每一个初等变换都有一个相应的初等矩阵。
- 互换矩阵的\(i\)行与\(j\)行的位置;
- 用数据\(P\)的非零数\(c\)乘\(E\)的\(i\)行;
- 把矩阵\(E\)的\(k\)倍加到\(i\)行;
- 同样可以得到与列变换相应的初等矩阵。
初等矩阵都是可逆的,他们的逆矩阵还是初等矩阵。
- 引理:
对一个\(s \times n\)矩阵\(A\)作一初等行变换就相当于在\(A\)的左边乘上相应的$s \times $初等s矩阵,
对\(A\)作一初等列变换就相当于在\(A\)的右边乘上相应的\(n \times n\)的初等矩阵
等价
矩阵\(A\)和\(B\)称为等价的,如果\(B\)可以由\(A\)经过一系列初等变换得到
等价是矩阵间的一种关系。不难证明,它具有自反性、对称性、传递性。
阶梯形矩阵
我们把形式如
的矩阵称为阶梯形矩阵。它们的任一行从第一个元素起至该行的第一个非零元素所在的下方全为零。如果该行为零,则它的下面的行也全为零。
任意一个矩阵经过一系列初等行变换总能变成阶梯形矩阵。
标准形
- 定理
任意一个\(s \times n\)矩阵\(A\)都与一形式为
的矩阵等价,它称为矩阵的标准形,主对角线上1的个数等于矩阵\(A\)的秩(1的个数可以是零)。
等价判定
根据引理,对矩阵作初等变换就相当于用相应的初等矩阵去乘这个矩阵。
- 矩阵\(A,B\)等价的充分必要条件是有初等矩阵\(P_1,\cdots ,P_l ,Q_1 ,\cdots ,Q_t\)使
矩阵初等变换与逆矩阵
\(n\)级可逆矩阵的秩为\(n\),所以可逆矩阵的标准形为单位矩阵;反过来也是对的。
- 定理 \(n\)级可逆矩阵\(A\)为可逆的充分必要条件是它能表示为一些初等矩阵的乘积
-
推论1 两个\(s \times n\)矩阵\(A、B\)等价的充分必要条件为,存在可逆的\(s\)级矩阵\(P\)与可逆的\(n\)级矩阵\(Q\),使\(A=PBQ\)
-
推论2 可逆矩阵总可以经过一系列初等行变换化为单位矩阵。
求逆矩阵的方法
设\(A\)是一个\(n\)级可逆矩阵。由推论2,有一系列矩阵\(P_1,\cdots ,P_m\)使
由上式得
上述两个式子说明,如果用一系列初等行变换把可逆矩阵\(A\)化为单位矩阵,那么同样地用这一系列初等行变换去化单位矩阵就能得到\(A^{-1}\)。
把\(A,E\)这两个\(n \times n\)矩阵放在一起,作为一个\(n \times 2n\)矩阵 \((A,E)\),按矩阵的分块乘法把(12),(13)合并有
(15)式提供了一个具体求逆矩阵的方法。
作\(n \times 2n\)矩阵\((A,E)\)用初等行变换把它的左边一半化为\(E\),这时,右边的一半就是\(A^{-1}\)。
矩阵的秩
-
行秩、列秩
矩阵的行秩就是指矩阵的行向量组的秩,矩阵的列秩就是矩阵的列向量组的秩
-
定理
矩阵的行秩与列秩相等。所以统称为矩阵的秩
秩与行列式的关系
-
子式
在一个\(s \times n\)矩阵\(A\)中任意选定\(k\)行和\(k\)列,位于这些选定的行和列的交点上的\(k^2\)个元素按着原来的次序所组成的\(k\)级行列式,称为\(A\)的一个\(k\)级子式。当然有\(k \leq min(s,n)\)
-
定理
一矩阵的秩是\(r\)的充分必要条件为矩阵中有一个\(r\)级子式不为零,同时所有\(r+1\)级子式全为零。
-
定理
\(n \times n\)矩阵
\[A=\left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots &\ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right ) \]的行列式为零的充分必要条件是\(A\)的秩小于\(n\)。
计算矩阵的秩
首先,矩阵的初等行变换是把行向量变成一个与之等价的向量组。等价的向量组有相同的秩,因此,初等行变换不改变矩阵的秩。同样,初等列变换也不改变矩阵的秩。
其次,阶梯形矩阵的秩就等于其中非零行的数目。
为了计算一个矩阵的秩,只要用初等行变换把它变成阶梯形矩阵,这个阶梯形矩阵中非零行的个数就是原来矩阵的秩。
矩阵加法的秩
\(秩(A+B)\leq 秩(A)+秩(B)\)
矩阵乘积的秩
-
定理
设\(A\)是数域\(P\)上$n \times \(m矩阵,\)B\(是数域\)P\(上\)m \times s$矩阵,于是
\[秩(AB) \leq min[秩(A),秩(B)] \]即乘积的秩不超过各因子的秩。
-
推论 用数学归纳法可以推广到多个因子的情形,
如果\(A=A_1A_2\cdots A_t\),那么\(秩(A) \leq \min_{1 \leq j \leq t}秩(A_j)\)
矩阵与行列式
矩阵的行列式
对于\(n\)级方阵
其行列式为
行列式的计算
一个\(n\)阶行列式可以看成由一个\(n\)级方阵\(A\)决定的,对于矩阵可以进行初等行变换变为阶梯形方阵,阶梯形方阵的行列式是上三角形的,也就等于对角线元素的乘积。
行列式的性质
- 一个数乘行列式的一行等于用这个数乘这个行列式,或说 一行的公因子可以提出去。
- 把一行的倍数加到另一行,行列式不变。
- 对换行列式中两行的位置,行列式反号。
由行列式的性质可以得知方阵进行初等行变换对行列式的值影响。
乘积的行列式
-
定理
设\(A,B\)是数域\(P\)上的两个\(n \times n\)矩阵,那么
即矩阵乘积的行列式等于它的因子的行列式的乘积。
- 推论1 推广到多个因子的情形
设\(A_1,A_2,\cdots ,A_m\)都是数域\(P\)上的\(n \times n\)矩阵,于是\(|A_1A_2\cdots A_m|=|A_1||A_2|\cdots|A_m|\)
非退化矩阵
数域\(P\)上的\(n \times n\)矩阵\(A\)称为非退化的,如果\(|A| \neq 0\);否则称为退化的。
-
推论2
设\(A、B\)是数域\(P\)上\(n \times n\)矩阵,矩阵\(AB\)为退化的充分必要条件是\(A、B\)中至少有一个是退化的。
矩阵的分块
把一个大矩阵看作是由一些小矩阵组成的,就如矩阵是由数组成的。特别在运算中,把这些小矩阵当做数来处理。这就是矩阵的分块
分块方法
-
把矩阵按块分。
设\(A=(a_{ik})_{sn},B=(b_{kj})_{nm}\),把\(A,B\)分成一些小矩阵其中各个\(A_{ij}\)是\(s_i \times n_j\)小矩阵,\(B_{ij}\)是\(n_i \times m_j\)小矩阵.
注意矩阵\(A\)的列的分法必须与矩阵\(B\)的行的分法一致。
-
把矩阵按行或列分 。可以看出\(AB\)的行向量是\(B\)的行向量的线性组合,\(AB\)的列向量是\(A\)的列向量的线性组合。
对角矩阵
对角矩阵 形式为
的矩阵,其中\(a_i\)是数\((i=1,2,\cdots,l)\),通常称为对角矩阵。
**准对角矩阵 **形式为
的矩阵,其中\(A_i\)是\(n_i \times n_i\)矩阵\((i=1,2,\cdots,l)\),通常称为准对角矩阵。
上(下)三角形矩阵
上三角形 矩阵\(A=(a_{ij})\)称为上三角形矩阵,如果\(i>j\)时有\(a_{ij}=0\)
下三角形 矩阵\(A=(a_{ij})\)称为下三角形矩阵,如果\(i<j\)时有\(a_{ij}=0\)
两个上(下)三角形矩阵的乘积仍然是上(下)三角形矩阵。
证明:
可逆的上(下)三角形矩阵的逆仍是上(下)三角形矩阵。
分块乘法的初等变换
将单位矩阵进行分块
对它进行
-
两行(列)对换,得到
\[\left ( \begin{matrix} O &E_m \\ E_n &O \end{matrix} \right ) \] -
某一行(列)左乘(右乘)一个矩阵\(P\),得到
\[\left ( \begin{matrix} P &O \\ O &E_n \end{matrix} \right ) , \left ( \begin{matrix} E_m &O \\ O &P \end{matrix} \right ) \] -
一行(列)加上另一行(列)的\(P\)(矩阵)倍数
\[\left ( \begin{matrix} E_m &P \\ O &E_n \end{matrix} \right ) , \left ( \begin{matrix} E_m &O \\ P &E_n \end{matrix} \right ) \]
和初等矩阵与初等变换的关系一样,用这些矩阵左乘任何一个分块矩阵,只要分块乘法能够进行,其结果就是对它进行相应的变换
-
\[\left ( \begin{matrix} O &E_m \\ E_n &O \end{matrix} \right ) \left ( \begin{matrix} A &B \\ C &D \end{matrix} \right ) = \left ( \begin{matrix} C &D \\ A &B \end{matrix} \right ) \]
-
\[\left ( \begin{matrix} P &O \\ O &E_n \end{matrix} \right ) \left ( \begin{matrix} A &B \\ C &D \end{matrix} \right ) = \left ( \begin{matrix} PA &PB \\ C &D \end{matrix} \right ) \]
-
\[\left ( \begin{matrix} E_m &O \\ P &E_n \end{matrix} \right ) \left ( \begin{matrix} A &B \\ C &D \end{matrix} \right ) = \left ( \begin{matrix} A &B \\ C+PA &D+PB \end{matrix} \right ) \]
可以适当选择\(P\),使得\(C+PA=O\),例如当\(A\)可逆时,选\(P=-CA^{-1}\),则\(C+PA=O\)
应用举例——求逆矩阵
求
的逆矩阵,其中\(A,B\)分别是\(k\)级和\(r\)级的可逆矩阵,\(C\)是\(r \times k\)矩阵,\(O\)是\(k \times r\)零矩阵。
首先 \(|D|=|A||B|\),所以当\(A,B\)可逆时,\(D\)也可逆。
-
方法1,分块矩阵乘法
设
\[D=\left ( \begin{matrix} X_{11} &X_{12}\\ X_{21} &X_{22} \end{matrix} \right ) \]于是
\[\left ( \begin{matrix} A &O \\ C &B \end{matrix} \right ) \left ( \begin{matrix} X_{11} &X_{12} \\ X_{21} &X_{22} \end{matrix} \right ) = \left ( \begin{matrix} E_{k} &O \\ O &E_{r} \end{matrix} \right ) \]这里的\(E_k,E_r\)分别表示\(k\)级和\(r\)级单位矩阵,乘出并比较等式两边,得
\[\begin{cases} AX_{11}=E_{k} \\ AX_{12}=O \\ CX_{11}+BX_{21}=O \\ CX_{12}+BX_{22}=E_{r} \\ \end{cases} \]解得
\[\begin{cases} X_{11}=A^{-1} \\ X_{12}=O \\ X_{21}=-B^{-1}CA^{-1} \\ X_{22}=B^{-1} \\ \end{cases} \]因此
\[D^{-1}= \left ( \begin{matrix} A^{-1} &O\\ -B^{-1}CA^{-1} &B^{-1} \end{matrix} \right ) \]特别地,当\(C=O\)时,有
\[\left ( \begin{matrix} A &O \\ O &B \end{matrix} \right ) ^{-1} = \left ( \begin{matrix} A^{-1} &O \\ O &B^{-1} \end{matrix} \right ) \] -
方法2, 初等变换
由(31)式有
\[\left ( \begin{matrix} E_m &O \\ -CA^{-1} &E_n \end{matrix} \right ) \left ( \begin{matrix} A &O \\ C &B \end{matrix} \right ) = \left ( \begin{matrix} A &O \\ O &B \end{matrix} \right ) \]及
\[\left ( \begin{matrix} A &O \\ O &B \end{matrix} \right ) ^{-1} = \left ( \begin{matrix} A^{-1} &O \\ O &B^{-1} \end{matrix} \right ) \]易知
\[D^{-1} = \left ( \begin{matrix} A^{-1} &O \\ O &B^{-1} \end{matrix} \right ) \left ( \begin{matrix} E_m &O \\ -CA^{-1} &E_n \end{matrix} \right ) =\left ( \begin{matrix} A^{-1} &O\\ -B^{-1}CA^{-1} &B^{-1} \end{matrix} \right ) \]
矩阵与线性方程组的求解
齐次线性方程组
判断有无非零解
-
方程个数
在齐次线性方程组
\[\begin{cases} a_{11}x_1 +a_{12}x_2+\cdots +a_{1n}x_n=0 \\ a_{21}x_1 +a_{22}x_2+\cdots +a_{2n}x_n=0 \\ \ \ \ \cdots \cdots \\ a_{s1}x_1 +a_{s2}x_2+\cdots +a_{sn}x_n=0 \\ \end{cases} \]中,如果\(s<n\)(方程个数<未知数个数),那么他必有非零解。
-
系数矩阵的秩
齐次线性方程组
-
的系数矩阵
的行秩\(r<n\),那么它有非零解。
-
系数矩阵的行列式
齐线性方程组
有非零解的充分必要条件是它的系数矩阵
的行列式等于零。
性质
- 两个解的和还是方程组的解。
- 一个解的倍数还是方程组的解。
解的线性组合还是方程组的解。
基础解系
齐次线性方程组(6)的一组解\(\eta_1,\eta_2,\cdots,\eta_t\)称为(6)的一个基础解系,如果
- (6)的任意一个解都能表示成\(\eta_1,\eta_2,\cdots,\eta_t\)的线性组合;
- \(\eta_1,\eta_2,\cdots,\eta_t\)线性无关
具体找基础解系的方法
-
定理
在齐次线性方程组有非零解的情况下,它有基础解系,并且基础解系所含解的个数等于\(n-r\),这里\(r\)表示系数矩阵的秩(\(n-r\)也就是自由未知量的个数)。
任何一个线性无关的与某一个基础解系等价的向量组都是基础解系。
设方程组的系数矩阵的秩为\(r\),方程组可以改写为
-
如果\(r=n\),方程组没有自由未知量,方程组右端为零,方程组只有零解。
-
分别用\(n-r\)组数\((1,0,\cdots,0),(0,1,\cdots,0),\cdots,(0,0,\cdots,1)\)来代替自由未知量\((x_{r+1},x_{r+2},\cdots,x_n)\),就得出方程组的\(n-r\)个解
\[\begin{cases} \eta_1=(c_{11},\cdots,c_{1r},1,0,\cdots,0) \\ \eta_2=(c_{21},\cdots,c_{2r},0,1,\cdots,0) \\ \ \ \ \cdots \cdots \\ \eta_{n-r}=(c_{n-r,1},\cdots,c_{n-r,r},0,0,\cdots,1) \\ \end{cases} \]上式就是一个基础解系,方程的任意一个解都可以由它表示出来。
一般线性方程组
矩阵
称为系数矩阵。
矩阵
称为增广矩阵。
有解的判别
- 线性方程组(1)有解的充分必要条件是它的系数矩阵\(A\)和增广矩阵\(\bar A\)有相同的秩。
-
用初等行变换将增广矩阵化为阶梯形矩阵。
-
如果系数矩阵与增广矩阵有相同的秩,方程组有解;
- 当增广矩阵的秩等于未知数个数时,方程组有唯一解;
- 当增广矩阵的秩小于未知数个数时,方程有无穷多个解。
-
当增广矩阵的秩等于系数矩阵的秩加1时,方程组无解。
-
解的结构 导出组
- 导出组:把一般线性方程组\[\begin{cases} a_{11}x_1 +a_{12}x_1+\cdots +a_{1n}x_1=b_1 \\ a_{21}x_1 +a_{22}x_1+\cdots +a_{2n}x_1=b_2 \\ \ \ \ \cdots \cdots \\ a_{s1}x_1 +a_{s2}x_1+\cdots +a_{sn}x_n=b_s \\ \end{cases} \]的常数项换为\(0\),就得到齐次线性方程组,\[\begin{cases} a_{11}x_1 +a_{12}x_1+\cdots +a_{1n}x_1=0 \\ a_{21}x_1 +a_{22}x_1+\cdots +a_{2n}x_1=0 \\ \ \ \ \cdots \cdots \\ a_{s1}x_1 +a_{s2}x_1+\cdots +a_{sn}x_n=0 \\ \end{cases} \]所得到的齐次线性方程组(17)称为原一般线性方程组(16)的导出组。
原一般线性方程组和它的导出组的解之间的关系
- 线性方程组(15)的两个解的差是它的导出组(16)的解。
- 线性方程组(15)的一个解与它的导出组(16)的一个解之和还是这个线性方程组的一个解。
-
定理
如果\(\gamma_0\)是方程组(15)一个特解,那么方程组(15)的任何一个解\(\gamma\)都可以表成
\[\gamma=\gamma_0+\eta \]其中\(\eta\)是导出组(16)的一个解。
因此,对于方程组(15)的任一个特解\(\gamma_0\),当\(\eta\)取遍它的导出组的全部解时,(17)就给出(15)的全部解。
-
如果\(\gamma_0\)是方程组(15)的一个特解,\(\eta_1,\eta_2,\cdots,\eta_s\)是其导出组的一个基础解系,那么(15)的任一个解\(\gamma\)都可以表成
\[\gamma=\gamma_0+k_1\eta_1+k_2\eta_2+\cdots+k_{n-r}\eta_{n-r} \] -
推论 在方程组(15)有解的条件下,解是唯一的充分必要条件是它的导出组(1)只有零解。
矩阵与二次型
二次型及其矩阵表示
- 设\(P\)是一数域,一个系数在数域\(P\)中的\(x_1,x_2,\cdots,x_n\)的二次齐次多项式
称为数域\(P\)上一个\(n\)元二次型,或简称为二次型。
- 把(1)的系数排成一个\(n \times n\)矩阵
它就称为二次型(1)的矩阵。
因为\(a_{ij}=a_{ji},i,j=1,\cdots,n\),所以,\(A'=A\)。因此二次型的矩阵都是对称的。
- 令\[X=\left ( \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{matrix} \right ) \]于是二次型可以用矩阵的乘积表示出来\[X'AX=(x_1,x_2,\cdots,x_n)\left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right )\left ( \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{matrix} \right )=f(x_1,x_2,\cdots,x_n) \]
二次型和它的矩阵是相互唯一决定的。
线性替换及其矩阵表示
-
线性替换 设\(x_1,\cdots,x_n;y_1,\cdots,y_n\)是两组文字,系数在数域\(P\)中的一组关系式
\[\begin{cases} x_1=c_{11}y_1 +c_{12}y_2+\cdots +c_{1n}y_n \\ x_2=c_{21}y_1 +c_{22}y_2+\cdots +c_{2n}y_n\\ \ \ \ \cdots \cdots \\ x_n=c_{n1}y_1 +c_{n2}y_2+\cdots +c_{nn}y_n \\ \end{cases} \]称为由\(x_1,\cdots,x_n\)到\(y_1,\cdots,y_n\)的一个线性替换。
如果系数行列式\(|c_{ij}|\neq 0\),那么线性替换(5)就称为非退化的。
线性替换把二次型变成二次型。
-
令
\[C=\left ( \begin{matrix} c_{11} & c_{12} & \cdots & c_{1n} \\ c_{21} & c_{22} & \cdots & c_{2n} \\ \vdots & \vdots & & \vdots \\ c_{n1} & c_{n2} & \cdots & c_{nn} \\ \end{matrix} \right ), Y= \left ( \begin{matrix} y_1 \\ y_2 \\ \vdots \\ y_n \\ \end{matrix} \right ) \]线性替换可以写成
\[\left ( \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{matrix} \right ) = \left ( \begin{matrix} c_{11} & c_{12} & \cdots & c_{1n} \\ c_{21} & c_{22} & \cdots & c_{2n} \\ \vdots & \vdots & & \vdots \\ c_{n1} & c_{n2} & \cdots & c_{nn} \\ \end{matrix} \right ) \left ( \begin{matrix} y_1 \\ y_2 \\ \vdots \\ y_n \\ \end{matrix} \right ) \]或者 \(X=CY\)
-
替换后的二次型的矩阵与原二次型的矩阵之间的关系
\[f(x_1,x_2,\cdots,x_n)=X'AX=(CY)'A(CY)=Y'(C'AC)Y=Y'BY \]因此 \(B=C'AC\)
合同变换
-
定义 数域\(P\)上\(n \times n\)矩阵\(A,B\)称为合同的,如果有数域\(P\)上可逆的\(n \times n\)矩阵\(C\),使 \(B=C'AC\)
合同是矩阵之间的一个关系。合同关系具有
- 自反性 \(A=E'AE\)
- 对称性 由 \(B=C'AC\)可以得到\(A=(C^{-1})'BC^{-1}\)
- 传递性 由\(A_1=C_1'AC_1,A_2=C_2’AC_2\)即得\(A_2=(C_1C_2)'A(C_1C_2)\)
因此,经过非退化的线性替换,新的二次型的矩阵与二次型的矩阵是合同的。
标准形
- 数域\(P\)上任意一个二次型都可以经过非退化的线性替换变为平方和\(d_1x_1^2+d_2x_2^2+\cdots+d_nx_n^2\)的形式.
二次型\(f(x_1,x_2,\cdots,x_n)\)经过非退化线性替换所变成的平方和称为\(f(x_1,x_2,\cdots,x_n)\)的一个标准形。
对应的矩阵是对角矩阵
-
在数域\(P\)上,任意一个对称矩阵都合同于一对角矩阵。
-
在一个二次型的标准形中,系数不为零的平方项的个数是唯一确定的,与所做的非退化线性替换无关,二次型矩阵的秩有时就称为二次型的秩
-
在一般的数域中,二次型的标准形不是唯一的而与所作的非退化的线性替换有关。
-
配方法
-
\(a_{ii}(i=1,2,\cdots,n)\)中至少有一个不为零,不妨设\(a_{11}\neq 0\),这时
\[f(x_1,x_2,\cdots,x_n)=a_{11}x_1^2+\sum_{j=2}^n{a_{1j}x_1x_j}+\sum_{i=2}^n{a_{i1}x_ix_1}+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \\ =a_{11}x_1^2+2\sum_{j=2}^n{a_{1j}x_1x_j}+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \ (合并x_1出现的交叉项)\\ =a_{11}(x_1+\sum_{j=2}^n{a_{11}^{-1}a_{1j}x_j})^2-a_{11}^{-1}(\sum_{j=2}^n{a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \ (把x_1凑成平方和) \\ =a_{11}(x_1+\sum_{j=2}^n{a_{11}^{-1}a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}x_ix_j} \\ 这里\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}x_ix_j}=-a_{11}^{-1}(\sum_{j=2}^n{a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j}是一个x_2,x_3,\cdots,x_n的二次型 \]令
\[\begin{cases} y_1=x_1+\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}x_j} \\ y_2=x_2\\ \ \ \ \cdots \cdots \\ y_n=x_n \\ \end{cases} \]即
\[\begin{cases} x_1=y_1-\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}y_j} \\ x_2=y_2\\ \ \ \ \cdots \cdots \\ x_n=y_n \\ \end{cases} \]这是一个非退化线性替换,它使
\[f(x_1,x_2,\cdots,x_n)=a_{11}y_1^2+\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}y_iy_j} \] -
所有\(a_{ii}=0\),但至少有一\(a_{qj}\neq 0(j>1)\),不妨设\(a_{12}\neq 0\)
令
\[ \begin{cases} x_1=z_1+z_2 \\ x_2=z_1-z_2\\ x_3=z_3\\ \ \ \ \cdots \cdots \\ x_n=z_n \\ \end{cases} \] 它是非线性替换,且使
\[ f(x_1,x_2,\cdots,x_n)=2a_{12}x_1x_2+\cdots \\ =2a_{12}(z_1+z_2)(z_1-z_2)+\cdots \\ =2a_{12}z_1^2-2a_{12}z_2^2 \] 这时上式右端是\(z_1,z_2,\cdots,z_n\)的二次型,且\(z_1^2\)的系数不为零。
-
-
合同变换法
-
\(a_{11}\neq 0\).这时的变数替换为
\[\begin{cases} x_1=y_1-\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}y_j} \\ x_2=y_2\\ \ \ \ \cdots \cdots \\ x_n=y_n \\ \end{cases} \]令
\[C_1= \left ( \begin{matrix} 1 & -a_{11}^{-1}a_{12} & \cdots & -a_{11}^{-1}a_{1n} \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & 1 \\ \end{matrix} \right ) \]则上述变数替换相应于合同变换
\[A \rightarrow C_1^{'}AC_1= \left ( \begin{matrix} a_{11} & O \\ O &A_1-a_{11}^{-1}a'a\\ \end{matrix} \right )\\ 这里 a=(a_{12},\cdots,a_{1n}),A_1=\left ( \begin{matrix} a_{22} & \cdots & a_{2n} \\ \vdots & & \vdots \\ a_{n2} & \cdots & a_{nn} \\ \end{matrix} \right ) \] -
\(a_{ii}=0,i=1,\cdots,n\)但有一\(a_{ij}\neq0,j\neq1\)
作合同变换\(P(2,j)'AP(2,j)\) 可以把\(a_{1j}\)搬到第一行第二列的位置,这样就变成了配方法中第二种情况。
与第二种情形的变数替换相对应,取
\[C_1= \left ( \begin{matrix} 1 & 1 &0& \cdots & 0 \\ 1 & -1 &0& \cdots & 0 \\ 1 & 1 &1& \cdots & 0 \\ \vdots & \vdots & \vdots& \cdots & 0 \\ 0 & 0 &0& \cdots & 1 \end{matrix} \right ) \]于是\(C_1'AC_1\)的左上角就是
\[\left ( \begin{matrix} a_{12} & 0 \\ 0 & -2a_{12} \\ \end{matrix} \right ) \]可以归结到第一种情形
-
规范形
-
复二次型的规范形
设\(f(x_1,x_2,\cdots,x_n)\)是一个复系数的二次型,经过一系列适当的非退化线性替换后,\(f(x_1,x_2,\cdots,x_n)\)变成标准形。
不妨假定它的标准形是\(d_1y_1^2+d_2y_2^2+\cdots+d_ry_r^2,d_i\neq 0,i=1,2,\cdots,r\),易知\(r\)就是\(f(x_1,x_2,\cdots,x_n)\)的秩。
因为复数总是可以开平方的,我们再做一个非退化的线性替换
\[\begin{cases} y_1=\frac{1}{\sqrt{d_1}}z_1 \\ \ \ \ \cdots \cdots \\ y_r=\frac{1}{\sqrt{d_r}}z_r\\ \ \ \ \cdots \cdots \\ y_{r+1}=z_{r+1}\\ \ \ \ \cdots \cdots \\ y_n=z_n \\ \end{cases} \]就变成
\[z_1^2+z_2^2+\cdots+z_r^2 \]上式称为复二次型的规范形
-
定理 任意一个复系数的二次型,经过一个适当的非退化线性替换可以变成规范形,并且规范形是唯一的
-
定理 任一复数的对称矩阵都合同于一个形式为
\[\left ( \begin{matrix} 1 & & & & & &\\ &\ddots & & & & & \\ & & 1 & & & & \\ & & & 0& & & \\ & & & &\ddots & & \\ & & & & & & 0 \\ \end{matrix} \right ) \]的对角矩阵,其中对角线上1的个数\(r\)等于\(A\)的秩。
两个复数对称矩阵合同的充分必要条件是它们的秩相等。
-
实二次型的规范形
设\(f(x_1,x_2,\cdots,x_n)\)是一个实系数的二次型,经过一系列适当的非退化线性替换后,再适当排列文字的次序,可使\(f(x_1,x_2,\cdots,x_n)\)变成标准形
\[d_1y_1^2+\cdots+d_py_p^2-d_{p+1}y_{p+1}^2-\cdots-d_ry_r^2,d_i>0,i=1,\cdots,r;r是二次型的秩 \]因为在实数域中,正实数总是可以开平方的,我们再做一个非退化的线性替换
就变成
上式称为实二次型的规范形,显然,规范形完全被\(r,p\)这两个数所决定。
-
定理 任意一个实系数的二次型,经过一个适当的非退化线性替换可以变成规范形,并且规范形是唯一的。
-
任一复数的对称矩阵都合同于一个形式为
\[\left ( \begin{matrix} 1 & & & & & &\\ &\ddots & & & & & \\ & & 1 & & & & \\ & & & -1& & & \\ & & & &\ddots & & \\ & & & & & & -1 \\ & & & & & & &0 \\ & & & & & & & &\ddots \\ & & & & & & & & &0 \\ \end{matrix} \right ) \]的对角矩阵,其中对角线上1的个数\(p\)及-1的个数\(r-p\)(\(r\)是矩阵\(A\)的秩)都是唯一确定的,分别称为\(A\)的正、负惯性指数,它们的差\(2p-r\)称为\(A\)的符号差。
两个复数对称矩阵合同的充分必要条件是它们的秩相等。
矩阵与线性空间
线性空间定义
-
非空集合 数域\(P\)上的一个非空集合\(V\)
-
对加法和数乘有封闭性
- 给出一个加法法则,对于\(V\)中任意两个元素\(\alpha\)与\(\beta\),在\(V\)中都有唯一的一个元素\(\gamma\)与它们对应,称为\(\alpha\)与\(\beta\)的和,记作\(\gamma=\alpha+\beta\)。
- 给出数量乘法运算,对于数域\(P\)中任一数\(k\)和\(V\)中任一元素\(\alpha\),在\(V\)中都有唯一的一个元素\(\delta\)与它们对应,称为\(k\)与\(\alpha\)的数量乘积,记作\(\delta=k\alpha\)。
-
满足8条规则
-
加法满足下面四条规则:
- 加法交换律\(\alpha+\beta=\beta+\alpha\);
- 加法结合律\((\alpha+\beta)+\gamma=\alpha+(\beta+\gamma)\);
- 零元素 在\(V\)中有一个元素\(0\),对于\(V\)中任一元素\(\alpha\)都有\(0+\alpha=\alpha\)。\(0\)称为\(V\)中的零元素。
- 负元素 对于\(V\)中的每一个元素\(\alpha\),都有\(V\)中的元素\(\beta\),使得\(\alpha+\beta=0\),。\(\beta\)称为\(\alpha\)的负元素。
-
数量乘法满足下面两条规则:
- 单位元素 \(1 \alpha=\alpha\)。
- \(k(l\alpha)=(kl)\alpha\)
-
数量乘法与加法满足下面两条规则
- \((k+l)\alpha=k\alpha+l\alpha\)
- \(k(\alpha+\beta)=k\alpha+k\beta\)
在以上规则中\(k,l\)表示数域\(P\)中的任意数;\(\alpha,\beta,\gamma\)表示集合\(V\)中的任意元素。
-
线性空间中的元素也称为向量,线性空间也称为向量空间。
向量空间中基变换与坐标变换
在同一向量空间下,同一个向量在不同基下的坐标是不同的。
设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)与\(\varepsilon_1',\varepsilon_2',\cdots,\varepsilon_n'\)是\(n\)维向量空间的两组基,它们的关系是
设$\xi $在这两组基下的坐标分别是 \(x_1,x_2,\cdots,x_n\)与$ x_1,x_2,\cdots,x_n$
将(3)式带入(4)得
上式给出了在基变换(3)下向量的坐标变换公式。
矩阵与线性变换
线性变换的定义
线性空间\(V\)到自身的映射通常称为\(V\)的一个变换。
-
定义
线性空间\(V\)的一个变换\(\mathscr{A}\)称为线性变换,如果对于\(V\)中任意的元素\(\alpha,\beta\)和数域\(P\)中的任意数\(k\)都有
\[\mathscr{A}(\alpha+\beta)=\mathscr{A}(\alpha)+\mathscr{A}(\beta) \\ \mathscr{A}(k\alpha)+k\mathscr{A}(\alpha) \]线性变换\(\mathscr{A}\)保持向量的加法和数量乘法。
-
恒等变换、单位变换 \(\mathscr{E}(\alpha)=\alpha \ \ (\alpha \in V)\)
-
零变换\(\mathscr{0}\) \(\mathscr{0}(\alpha)=0 \ \ (\alpha \in V)\)
-
数乘变换 设\(V\)是数域\(P\)上的线性空间,\(k\)是数域\(P\)上的某个数,定义\(V\)的变换:\(\alpha \rightarrow k\alpha, \ \ \alpha\in V\)
这是一个线性变换,称为由数\(k\)决定的数乘变换。
-
简单性质
-
线性空间\(V\)的一个线性变换\(\mathscr{A}\),则\(\mathscr{A}(0)=0,\mathscr{A}(-a)=-\mathscr{A}(a)\)
-
线性变换保持线性组合不变
\[\beta=k_1\alpha_1+k_2\alpha_2+\cdots+k_r\alpha_r \\ \mathscr{A}(\beta)=k_1\mathscr{A}(\alpha_1)+k_2\mathscr{A}(\alpha_2)+\cdots+k_r\mathscr{A}(\alpha_r) \\ \] -
线性变换把线性相关的向量组变成线性相关的向量组。
-
线性变换\(\mathscr{A}\)在下基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)的矩阵
-
设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是线性空间\(V\)的一组基。
如果线性变换\(\mathscr{A}\)与\(\mathscr{B}\)在这组基上的作用相同,即\(\mathscr{A}\varepsilon_i=\mathscr{B}\varepsilon_i,\ \ i=1,2,\cdots,n\) 那么\(\mathscr{A}=\mathscr{B}\)。
意义:一个线性变换完全被它在一组基上的作用决定
-
设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是线性空间\(V\)的一组基。
对于任意一组向量\(\alpha_1,\alpha_2,\cdots,\alpha_n\),一定有一个线性变换\(\mathscr{A}\)使\(\mathscr{A}\varepsilon_i=\alpha_i,i=1,2,\cdots,n\)
意义:基向量的像完全可以是任意的
-
定理
设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是线性空间\(V\)的一组基,\(\alpha_1,\alpha_2,\cdots,\alpha_n\)是\(V\)中的任意\(n\)个向量。
存在唯一的线性变换\(\mathscr{A}\)使\(\mathscr{A}\varepsilon_i=\alpha_i,i=1,2,\cdots,n\)
-
定义
设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是数域\(P\)上\(n\)维线性空间\(V\)的一组基,\(\mathscr{A}\)是\(V\)的一个线性变换。
基向量的像可以被基线性表出:
\[\begin{cases} \mathscr{A}\varepsilon_1=a_{11}\varepsilon_1 +a_{12}\varepsilon_2+\cdots +a_{1n}\varepsilon_n \\ \mathscr{A}\varepsilon_2=a_{21}\varepsilon_1 +a_{22}\varepsilon_2+\cdots +a_{2n}\varepsilon_n \\ \ \ \ \cdots \cdots \\ \mathscr{A}\varepsilon_n=a_{n1}\varepsilon_1 +a_{n2}\varepsilon_2+\cdots +a_{nn}\varepsilon_n \\ \end{cases} \\ \mathscr{A}(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n) =(\mathscr{A}\varepsilon_1,\mathscr{A}\varepsilon_2,\cdots,\mathscr{A}\varepsilon_n) =(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n) \left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{s1} & a_{s2} & \cdots & a_{sn} \\ \end{matrix} \right ) \\ A= \left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{s1} & a_{s2} & \cdots & a_{sn} \\ \end{matrix} \right ) \]其中\(A\)称为线性变换\(\mathscr{A}\)在下基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)的矩阵
在取定一组基后,我们就建立了由数域\(P\)上的\(n\)维线性空间\(V\)的线性变换到数域\(P\)上的\(n \times n\)矩阵的一个映射,1说明这个映射是单射,2说明是满射,因此这个映射是一一对应的(双射)。
-
定理
设\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)是数域\(P\)上\(n\)维线性空间\(V\)的一组基,在这组基下,每个线性变换按着公式(3)对应一个\(n \times n\)矩阵。这个对应具有以下性质:
- 线性变换的和对应矩阵的和;
- 线性变换的乘积对应矩阵的乘积;
- 线性变换的数量乘积对应矩阵的数量乘积;
- 可逆的线性变换与可逆矩阵对应,且逆变换对应逆矩阵。
定理说明,数域\(P\)上\(n\)维线性空间\(V\)的全部线性变换构成的集合\(L(V)\)对于线性变换的加法与数量乘法构成\(P\)上一个线性空间,与数域\(P\)上\(n\)级方阵构成的线性空间\(P^{n \times n}\)同构。
线性变换的矩阵计算向量的像
-
定理
设线性变换\(\mathscr{A}\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的矩阵是\(A\),向量\(\xi\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的坐标是\((x_1,x_2,\cdots,x_n)\),
则\(\mathscr{A}\xi\)在基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)下的坐标\((y_1,y_2,\cdots,y_n)\)可以按公式
\[\left ( \begin{matrix} y_{1} \\ y_{2} \\ \vdots \\ y_{n} \\ \end{matrix} \right ) =A \left ( \begin{matrix} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \\ \end{matrix} \right ) \]计算。
线性变换的矩阵与基的关系
-
定理
线性空间\(V\)的线性变换\(\mathscr{A}\)在两组基
\[\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n \\ \eta_1,\eta_2,\cdots,\eta_n \]下的矩阵分别是\(A,B\),从基\(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n\)到基\(\eta_1,\eta_2,\cdots,\eta_n\)的过渡矩阵是\(X\),于是\(B=X^{-1}AX\).
这个定理告诉我们,同一个线性变换\(\mathscr{A}\)在不同基下的矩阵之间的关系。
相似
-
定义 相似
设\(A、B\)是数域\(P\)上两个\(n\)级矩阵,如果可以找到数域\(P\)上的\(n\)级可逆矩阵\(X\),使得\(B=X^{-1}AX\),就说\(A\)相似于\(B\),记作\(A \sim B\)
-
性质
- 自反性 \(A\sim A\)
- 对称性 \(A \sim B ,B \sim A\)
- 传递性 \(A \sim B ,B \sim C\),则\(A \sim C\)
-
定理
线性变换在不同基下所对应的矩阵是相似的。
如果两个矩阵相似,那么它们可以看作同一个线性变换在两组基下所对应的矩阵。
-
运算性质
如果\(B_1=X^{-1}A_1X,B_2=X^{-1}A_2X\),那么
- \(B_1+B_2=X^{-1}(A_1+A_2)X\)
- \(B_1B_2=X^{-1}(A_1A_2)X\)
- 若\(f(x)\)是数域\(P\)上一多项式 \(f(B)=X^{-1}f(A)X\)
本文来自博客园,作者:{珇逖},转载请注明原文链接:https://www.cnblogs.com/zuti666/p/13580010.html