矩阵论总结
1.线性空间:
加法具有封闭性和唯一性——结合律、交换律、零元、任意元素都存在负元。唯一性代表相加起来,不会既等于a,又等于b。零元指的是和x相加还等于x的元素,而不是指普通的数零。
数乘具有封闭性和唯一性——结合律、两个分配率(将常数或向量分配)、恒等率(1指的是普通的数一)
ps:理解线性空间的时候,可以假设线性空间中的每个元素都是一个向量
线性空间性质:零元和负元都是唯一的
2.基:极大线性无关组的个数称为线性空间的维数,dimV。极大线性无关组就是基。证明是基:1)证明线性无关 2)证明任意元素都可以由基进行表示。
坐标:用基表示某个向量时,基旁边数字的组成的向量就是坐标。
过渡矩阵:Y=XC代表Y中的每个分量都是由X中分量的线性组合而成的,称C为从基X到基Y的过渡矩阵。若在X上的坐标为a,则在Y上的坐标b= C − 1 C^{-1} C−1a。
利用基表示向量时,不同基会对应不同的坐标,但基和坐标的乘积始终是等于所表示的向量的。
3.线性子空间:某线性空间的子空间满足加法和数乘的封闭性,则此子空间称为线性子空间。(以后没有特殊说明子空间就是线性子空间)
线性子空间的性质:(1)线性子空间的零元和线性空间的零元是同一个。(2)线性子空间仍为线性空间
生成子空间:由线性空间中某个元素组 x 1 、 x 2 、 … … 、 x m x_1、x_2、……、x_m x1、x2、……、xm中的元素的线性组合得到空间,叫做由此元素组生成的子空间,记作L( x 1 、 x 2 、 … … 、 x m x_1、x_2、……、x_m x1、x2、……、xm)
基扩定理:给 V n V^n Vn的线性子空间 V 1 m V_1^m V1m的基添加n-m个向量就变成了 V n V^n Vn的基,这nm???
线性子空间的交:集合的交,即元素相同的拿出来
线性子空间的和:两个集合中分别任意拿一个元素出来进行相加。线性子空间的交与和还是线性子空间。
V 1 和 V 2 是 同 一 线 性 空 间 的 线 性 子 空 间 , 则 d i m ( V 1 + V 2 ) + d i m ( V 1 ∩ V 2 ) = d i m ( V 1 ) + d i m ( V 2 ) V_1和V_2是同一线性空间的线性子空间,则dim(V_1+V2)+dim(V1 \cap V_2)=dim(V_1)+dim(V_2) V1和V2是同一线性空间的线性子空间,则dim(V1+V2)+dim(V1∩V2)=dim(V1)+dim(V2),dim代表维度(基中向量的个数)
线性子空间的直和:线性子空间的直和还是线性子空间的和,只是要求元素的和都是不相同的。
和为直和的三种等价形式:1)交为零 2) d i m ( V 1 + V 2 ) = d i m V 1 + d i m V 2 dim(V_1+V_2)=dimV_1+dimV_2 dim(V1+V2)=dimV1+dimV2 3) V 1 V_1 V1的基和 V 2 V_2 V2的基组成的集合为 V 1 + V 2 的 基 V_1+V_2的基 V1+V2的基
4.Tx=y,y叫做象,x叫做原象
线性变换:T(kx+ly)=kT(x)+lT(y)。线性变换的运算:加、数乘、乘法、逆、多项式。
线性变换的矩阵表示:T(x)=xA,A代表变换T对应的矩阵,x代表基组成的向量组。任意向量可以表示成 x ξ x\xi xξ,则有 T ( x ξ ) = x A ξ T(x\xi)=xA\xi T(xξ)=xAξ。线性变换的运算:加、数乘、乘法、逆、多项式。
相似:T在同一线性空间下的不同基下的矩阵之间是相似的。
矩阵的值域R: Ax的集合。矩阵的核N:Ax为零时的x的集合。
定理:1) dimR+dimN=dimV=n,n为A的列数 2) dimR=rankA,rank代表秩
5.特征值与特征向量:通过det( λ I − A \lambda I-A λI−A)=0 求 λ 求\lambda 求λ, 将 λ 代 入 将\lambda代入 将λ代入 λ I − A = 0 \lambda I-A=0 λI−A=0中求基础解系(特征值)
四个定理:1)tr(AB)=tr(BA) 2)AB与BA的特征值只差零特征值的个数,非零特征值相同 3)n阶方阵可通过相似变换对角化的充要条件是它具有n 个线性无关的特征向量。 4)任意n阶方阵A与上三角矩阵相似
Euclid空间(欧氏空间):交换律、分配律、齐次律、非负律(等零才为零)
度量矩阵(Gram矩阵):一个由欧氏空间的基中向量的内积组成的正定对称矩阵
酉空间:除了交换律和Euclid空间不一样外,其他都是一样的。是Euclid空间在复数中的推广。
柯西-施瓦茨不等式: < a , b > 2 ≤ < a , a > < b , b > <a,b>^2 \leq <a,a><b,b> <a,b>2≤<a,a><b,b>
施密特正交化(单位化和正交化):待正交化的向量a-其他已正交化向量b的k倍,k为a和b的内积除以b的模的平方
6.A的共轭转置 A H A^H AH: A T A^T AT中所有复数的虚部都变号就得到A的共轭转置
厄米矩阵(Hermite 矩阵):满足 A = A H A=A^H A=AH的A矩阵
正规矩阵: A H A = A A H A^HA=AA^H AHA=AAH、 A T A = A A T A^TA=AA^T ATA=AAT
正交矩阵: A A T = A T A = I , A T = A − 1 AA^T=A^TA=I,A^T=A^{-1} AAT=ATA=I,AT=A−1。 P − 1 A P P^{-1}AP P−1AP为对A的正交相似变换
酉矩阵: A A H = A H A = I , A H = A − 1 AA^H=A^HA=I,A^H=A^{-1} AAH=AHA=I,AH=A−1。 U H A U U^{H}AU UHAU为对A的酉相似变换
schur定理:任何方阵A都可以通过某个酉矩阵U化为上三角矩阵。 U − 1 A U = U H A U U^{-1}AU=U^HAU U−1AU=UHAU=上三角矩阵(如何化呢??)
酉相似于对角阵:n阶方阵 A,酉相似于对角阵(就是通过酉相似变换可以化成对角阵)的充要条件是: A为正规阵(实或复)。
不变子空间:Tx还在V1中
线性空间可以分解为不变子空间的直和,线性空间的基等于不变子空间的基合并起来
T在某基下的矩阵A为对角矩阵的充要条件线性空间可以分解为不变子空间的直和
7.jordan标准型:化出很多个jordan块。jordan块:主对角线有元素,副对角线只可能有元素1
1)笨方法求jordan标准型:求矩阵 ( A − λ (A-\lambda (A−λ)中所有非零的i阶的行列式(任意取i行和i列组成的行列式),然后这些行列式的最大公因式记为 D i D_i Di,如果 D i D_i Di的最高幂次项的系数不为1,要除一个数让其变为一。 d i ( λ ) = D i ( λ ) D i − 1 ( λ ) d_i(\lambda)=\frac{D_i(\lambda)}{D_{i-1}(\lambda)} di(λ)=Di−1(λ)Di(λ), d i ( λ ) d_i(\lambda) di(λ)中的每个相乘的式子都是一个初等因子。2)每个初等因子形成一个jordan块
初等变换求jordan标准型:经过初等变换得到一个关于 λ \lambda λ的对角阵(初等 变换不改变行列式因子),然后根据“笨方法求jordan标准型”就容易了
多项式矩阵的初等变换:互换、 乘 λ 乘\lambda 乘λ的多项式加到行(列)(不能除以 λ \lambda λ的多项式)、乘以非零\非 λ \lambda λ的多项式的常数。
D i 叫 行 列 式 因 子 , d i 叫 不 变 因 子 , d i D_i叫行列式因子,d_i叫不变因子,d_i Di叫行列式因子,di叫不变因子,di中的每个相乘的式子都叫初等因子
8. P − 1 A P = J , 即 A P = P J P^{-1}AP=J,即AP=PJ P−1AP=J,即AP=PJ
jordan 标准型的变换矩阵P求法:1)用每一个Jordan块,求出P中对应的几个列组成的矩阵 P i P_i Pi 2)求 P i P_i Pi中对应列的方法是,分别求 P i P_i Pi每一个列。求 P i P_i Pi每一个列的方法如下
- 通过“ ( A − λ ) j (A-\lambda)^j (A−λ)j乘于 P i P_i Pi的第j列等于零”求 P i P_i Pi的第j列,此时求出的第j列一般是一个通解,从通解中取一个解(j为 P i P_i Pi的阶数)
- 要求取出来的这个解满足: ( A − λ ) j − 1 (A-\lambda)^{j-1} (A−λ)j−1乘以这个解不等于零,保证求解过程中不出现零向量
- 通过“ ( A − λ ) (A-\lambda) (A−λ)乘于 P i P_i Pi的第j列等于j-1列”求j-1列
原理: ( A − λ ) j (A-\lambda)^j (A−λ)j乘于 P i P_i Pi的第j列等于零, ( A − λ ) (A-\lambda) (A−λ)乘于 P i P_i Pi的第j列等于j-1列。特别的,当Jordan标准型是一个对角阵的时候,每个 P i P_i Pi都只含有一列,此时就是计算 ( A − λ ) x = 0 (A-\lambda)x=0 (A−λ)x=0的解。
注意:同一特征值的不同jordan块求出列向量要线性无关(应该是,我也没看懂)?????
9.利用Jordan标准形求矩阵函数f(A):(此方法一般不用,除非A本身就是Jordan标准型)
1)Jordan标准型:通过求 ( A − λ (A-\lambda (A−λ)的各阶非零行列式的公因式,进而求出Jordan标准型。
2)求变换矩阵P
2)分别求每一个jordan块的矩阵函数,即 f ( J i ) f(J_i) f(Ji)。可证明 f ( J i ) f(J_i) f(Ji)为类似的上三角形条带矩阵(条带矩阵:在与主对角线平行的斜线上各元素相等)。从对角线为第一个条带开始,第j个条带上的值为 f ( λ i ) f(\lambda_i) f(λi)的j-1次导,除以j-1的阶乘。3)f(A)= P f ( J ) P − 1 Pf(J)P^{-1} Pf(J)P−1。
10.矩阵序列 A ( k ) A^{(k)} A(k):矩阵中的元素都是由k表示。当k趋于无穷大的时候,矩阵中的元素都趋于某一个数时,则称序列的极限是存在。
收敛矩阵序列 A ( k ) A^{(k)} A(k)的性质:线性组合、相乘、取逆、乘任意矩阵
收敛矩阵:设A为方阵,且当 k → ∞ k\rightarrow \infty k→∞时 A k → 0 A^k\rightarrow0 Ak→0 , 则称A为收敛矩阵
矩阵级数:序列中所有无穷个矩阵相加,即 ∑ k = 1 ∞ A ( k ) \sum_{k=1}^\infty A^{(k)} ∑k=1∞A(k)。 ∑ k = 1 ∞ A ( k ) \sum_{k=1}^\infty A^{(k)} ∑k=1∞A(k)中所有元素收敛,则该级数收敛。先求 ∑ k = 1 ∞ A ( k ) \sum_{k=1}^\infty A^{(k)} ∑k=1∞A(k)的前N项和S,然后让 N → ∞ N\rightarrow \infty N→∞。
绝对收敛矩阵: ∑ k = 1 ∞ A ( k ) \sum_{k=1}^\infty A^{(k)} ∑k=1∞A(k)中所有元素绝对收敛,则该级数绝对收敛。(绝对收敛:各项的绝对值所构成的级数收敛)
绝对收敛矩阵的性质:调换项的顺序、每个项的左边乘P,右边乘Q、相乘(相乘没看懂)
11.Neumann级数: ∑ k = 1 ∞ A k \sum_{k=1}^\infty A^k ∑k=1∞Ak称为A的Neumann级数。Neumann级数收敛的充要条件为A为收敛。并且Neumann级数收敛于 ( 1 − A ) − 1 (1-A)^{-1} (1−A)−1
矩阵函数:以矩阵为自变量,如求 e A e^A eA,首先将 e x e^x ex进行泰勒展开,然后用A代x得到 e A e^A eA
三大矩阵函数:指数、正弦、余弦、以及它们的性质和注意点
Hamilton-Cayley定理:n阶矩阵A是其特征多项式的零点,也就是说根据特征多项式可以得出一个关于A的等式。
零化多项式:多项式f(z),若f(A)=0,则称其为A的零化多项式。方阵A的特征多项式为A的零化多项式。
-
利用Jordan标准形求矩阵函数f(A):(此方法一般不用,除非A本身就是Jordan标准型)
1)Jordan标准型:通过求 ( A − λ (A-\lambda (A−λ)的各阶非零行列式的公因式,进而求出Jordan标准型。
2)求变换矩阵P
2)分别求每一个jordan块的矩阵函数,即 f ( J i ) f(J_i) f(Ji)。可证明 f ( J i ) f(J_i) f(Ji)为类似的上三角形条带矩阵(条带矩阵:在与主对角线平行的斜线上各元素相等)。从对角线为第一个条带开始,第j个条带上的值为 f ( λ i ) f(\lambda_i) f(λi)的j-1次导,除以j-1的阶乘。3)f(A)= P f ( J ) P − 1 Pf(J)P^{-1} Pf(J)P−1。
13.利用零化多项式求解矩阵函数 f ( A ) f(A) f(A):(总结:求最小多项式得待定系数多项式,求代入不同特征值求系数)
1)求出最小多项式,n阶方阵A的最小多项式等于它的特征矩阵的第n个不变因子 d n ( λ ) d_n(\lambda) dn(λ)
最小多项式就是满足 f ( A ) = 0 f(A)=0 f(A)=0的最小次数的多项式
2)如果 d n ( λ ) d_n(\lambda) dn(λ)中 λ \lambda λ的最高次为m+1,则形式上写出待定系数的m次多项式 g ( λ ) g(\lambda) g(λ)
3)看最小多项式中 λ i \lambda_i λi对应的次数为k,最后利用 g ( j ) ( λ i ) = f ( j ) ( λ i ) g^{(j)}(\lambda_i)=f^{(j)}(\lambda_i) g(j)(λi)=f(j)(λi)求解 g ( λ ) g(\lambda) g(λ) 中的待定系数,(j=0~k-1,j代表求导次数, λ i \lambda_i λi代表最小多项式中的一个特征值),从而求解 g ( λ ) g(\lambda) g(λ)。 f ( A ) = g ( A ) f(A)=g(A) f(A)=g(A)
14.矩阵的微分和积分及其性质
矩阵的求导规则:
一阶线性齐次常系数常微分方程组 d x d t = A x ( t ) \frac{dx}{dt}=Ax(t) dtdx=Ax(t),则其解为 x ( t ) = e ( t − t 0 ) A x ( t 0 ) = e t A x ( 0 ) x(t)=e^{(t-t_0)A}x(t_0)=e^{tA}x(0) x(t)=e(t−t0)Ax(t0)=etAx(0)。就是求矩阵函数 e ( t − t 0 ) A e^{(t-t_0)A} e(t−t0)A或 e t A e^{tA} etA
一阶线性非齐次常系数常微分方程组 d x d t = A x ( t ) + b ( t ) \frac{dx}{dt}=Ax(t)+b(t) dtdx=Ax(t)+b(t),则其解为 x ( t ) = e t A [ x ( 0 ) + ∫ 0 t e − s A b ( s ) d s ] x(t)=e^{tA}[x(0)+\int_{0}^{t}e^{-sA}b(s)ds] x(t)=etA[x(0)+∫0te−sAb(s)ds]
高阶线性非齐次常系数常微分方程组化为一阶(应该不考吧)
15.矩阵的三角分解(让计算机可以实现矩阵分解):
Gauss消元法的矩阵形式:
A ( 1 ) = L 1 − 1 A A^{(1)}=L_1^{-1}A A(1)=L1−1A的结果为A的第一列只剩了第一个元素。这里 L 1 − 1 L_1^{-1} L1−1的作用是将第一行分别乘以某个数然后加到其他行上,从而消掉A的第一列中除第一个元素外的其他元素。
A的Frobenius矩阵 L 1 L_1 L1的构造方式:主对角线为一, c i 1 = a i 1 a 11 , ( i = 2 , 3 , … n ) c_{i1}=\frac{a_{i1}}{a_{11}},(i=2,3,…n) ci1=a11ai1,(i=2,3,…n),其余位置都为零。 L 1 − 1 L_1^{-1} L1−1为 L 1 L_1 L1中的 c i 1 c_{i1} ci1变号。 c i 1 c_{i1} ci1就是A的第一列的所有元素都除以第一个元素
按照类似的原理构造 L 2 L_2 L2:主对角线为一, c i 2 = a i 2 ( 1 ) a 22 ( 1 ) , ( i = 3 , 4 , , … n ) c_{i2}=\frac{a_{i2}^{(1)}}{a_{22}^{(1)}},(i=3,4,,…n) ci2=a22(1)ai2(1),(i=3,4,,…n),其余位置都为零。
最后得到 A = L 1 L 2 L 3 … L n − 1 A ( n − 1 ) = L A ( n − 1 ) A=L_1L_2L_3…L_{n-1}A^{(n-1)}=LA^{(n-1)} A=L1L2L3…Ln−1A(n−1)=LA(n−1),其中L是一个下三角矩阵(Low), A ( n − 1 ) A^{(n-1)} A(n−1)为上三角矩阵(Upper),这叫做LU分解 。
A可以分解成 L A ( n − 1 ) LA^{(n-1)} LA(n−1), A ( n − 1 ) A^{(n-1)} A(n−1)进一步可以分解成DU,故A可以分解成LDU。L和U分别为单位下三角矩阵和单位上三角矩阵,D为对角阵 d i a g [ d 1 , d 2 , … d n ] diag[d_1,d_2,…d_n] diag[d1,d2,…dn],而 d k = d_k= dk=A的k阶主子式除以A的k-1阶主子式。所以能直接求出的为L和D,然后利用DU= A ( n − 1 ) A^{(n-1)} A(n−1)求出U。 因为D是一个对角阵,所以D上面的每行的元素都只是让U中每行元素翻某个倍数而已,所以利用这个原理就可以很容易求出U。【注】若 d n = 0 d_n=0 dn=0时,即D的对角线的最后一个元素为零时,此时U的对角线的最后一个元素要设为1,而不是零。
n阶非奇异矩阵A有三角分解LU或LDU的充要条件是A的顺序主子式不为零
其他三角分解(相应的视频内容还没看)
Doolittle分解:$A=L\hat{U}(\hat{U}=DU) $
Crout分解:$A=\hat{L}U(\hat{L}=LD) $
Cholesky分解:当A为实对称正定矩阵时, A = L D ~ 2 U = ( L D ~ ) ( L D ~ ) T A=L\tilde{D}^2U=(L\tilde{D})(L\tilde{D})^T A=LD~2U=(LD~)(LD~)T,其中 D ~ 2 = d i a g [ d 1 , d 2 , … d n ] \tilde{D}^2=diag[\sqrt{ d_1},\sqrt{ d_2},…\sqrt{ d_n}] D~2=diag[d1,d2,…dn]
16.矩阵的QR分解:将矩阵A分解为正交(酉)矩阵乘以实(复)上三角阵
Givens矩阵与Givens变换:
有实数的形式和复数的形式两种。(复数形式应该不考)
性质:Givens矩阵的转置为Givens矩阵的逆
QR分解:先从所要分解的矩阵A的第一 列开始,利用好多个Givens矩阵(A左乘Givens矩阵。每个Givens矩阵只能消掉一个零)将第一列消成只有第一个元素不为零,其余元素都为零。进行类似的过程,将矩阵消成上三角矩阵。
Householder矩阵与Householder变换:
QR分解:先求出第一行对应的单位向量u,再求出变换矩阵H,A左乘H矩阵
施密特正交化实现RQ分解:1)A中各列a1,a2,a3对应的正交化后的向量b1,b2,b3,然后将A中各列用向量b1,b2,b3的 线性组合进行表示,则可得A=BC,B是b1,b2,b3为列向量的矩阵。最后将B中各列进行单位化B=QD,得到A=QDC=QR。
施密特正交化:待正交化的向量a − - −其他已正交化向量b的k倍,k为a和b的内积除以b的模的平方
17.矩阵的满秩分解:将矩阵A分解成一个列满秩矩阵乘行满秩矩阵
Hermite标准形(行阶梯标准形):首先需要呈现行阶梯形,然后要求每一行的第一个非零元素为1且此非零元素对应列的其他元素都为零。利用初等行变换就可以将矩阵化为Hermite标准形
矩阵的满秩分解:1)利用初等变换得到G,利用G得到P,F=AP,最后得到A=FG
18.酉对角分解与奇异值分解
非奇异矩阵(行列式不等于零)的酉对角分解:。。。
。。。
19.Penrose广义逆矩阵与{1}-逆的性质
定理:满足四个Penrose方程的广义逆矩阵是唯一的。
需要掌握:A{1},A{1,2},A{1,3},A{1,4},A{1,2,3,4}= A + A^+ A+
考试会要求证明某矩阵是否为某矩阵的{1}-逆矩阵。此时用定义即可。{1}-逆的九条性质要学会证明