线性代数(Ax=λx)
此篇文章以中文标题,是为了主张在国外的数学研究环境下面对国内研究生应试,因此以中文标题。文章中将几乎不会出现英文
\(λ\)英文为lambda
转载请说明出处
线性代数\(Ax=λx\)
这篇文章主要讲考研数学的重点之一,也是线性代数(数学专业中这一部分会并入高等代数中,实际上线性代数是对这一部分最精确的描述,如MIT等大学采用的方式)中关于“变化(change)”的一部分。微分即是对连续函数变化的讨论。
\(Ax=λx\)是基本公式。
行列式\(|A-λI|\)采用考研方式,原文是\(det(A-λI)\),后不赘述。
特征值简介(基础)
\(Ax=λx\)意为特征向量\(x\)在乘\(A\)后时保持相同的方向。而\(λ\)特征值为特定向量\(x\)的变化率。
- 特征向量 \(x\) 与 \(Ax\) 位于同一条线上:\(Ax=λx\)。特征值是\(λ\)
- 如果 \(Ax=λx\) 那么 \(A^2x=λ^2x\) 并且 \(A^{-1}x=λ^{-1}x\)且\((A+cI)x=(λ+c)x\):\(x\)是相同的
- 如果 \(Ax=λx\) 那么 \((A-λI)x=0\) 且 \(A-λI\)是奇异的,并且\(|A-λI|=0\)。\(n\)个特征值。
- 通过\(|A|=(λ_1)(λ_2)...(λ_3)\)和对角线和\(\Sigma{a_{nn}}=\Sigma{λ}\)检查特征值\(λ\)
- 投影矩阵的\(λ=1和0\)。反射矩阵的\(λ=1和-1\)。旋转矩阵的\(λ=e^{iθ}和e^{-iθ}\):复数!
我们想要当 \(λ\) 乘以 \(A\) 时不会改变方向的特征向量 \(x\)。
几乎所有的向量在乘以\(A\)的时候都会更改方向,但某些异常向量 \(x\) 与 \(Ax\) 方向相同。这些是特征向量。
而特征值\(λ\)告诉我们特征向量的状态(变化率或不变),当其为0时,意味特征向量\(x\)在零空间。
注意:特征向量是不唯一但是方向唯一的。而\(A\)列向量是由\(A\)的特征向量组合而成的。解决诸如\(A^{100}\)之类的变化问题使用的是特征值。因为特征值是特定向量的变化率,所以当特征值为0到1之间时,通过\(A^{100}\)的变换,这个特征值将会变成一个很小的接近于0的向量。
附录:Markov矩阵指的是最大特征值为1的矩阵,这种矩阵\(n(n\to+\infty)\)次幂\(A^n\)必将达到稳定态(原因如上),Google使用Markov矩阵指导用户搜索。
计算n阶矩阵的特征值
当且仅当\(A-λI\)奇异时,数字\(λ\)是\(A\)的特征值。
- 计算\(A-λI\)的行列式。沿对角线减去λ,该行列式以\(λ^n\)或\(-λ^n\)开头。这是一个\(λ\)的\(n\)次多项式。
- 求解\(|A-λI|\)以找到多项式的根。这\(n\)个根是\(A\)的\(n\)个特征值。它们使\(A-λI\)奇异。
- 对于每个特征值\(λ\),求解\((A-λI)x=0\)以找到特征向量\(x\)。
行列式和迹
- \(n\)个特征值的积等于行列式
- \(n\)个特征值的和等于n个对角线元素的总和
- A的迹\(=\Sigma{a_{nn}}=\Sigma{λ}\)
矩阵对角化(\(AX=XΛ\))(基础,考点:对角矩阵,相似矩阵与相似对角化)
- \(AX=XΛ\)的列即\(Ax_k=λ_kx_k\)。特征矩阵\(Λ\)是对角化的。
- \(X\) 中的 \(n\) 个独立特征向量对角化 \(A\), \(A=XΛX^{-1}且Λ=X^{-1}AX\)
- 特征向量矩阵 \(X\) 也对角化所有的幂 \(A^k\): \(A^k=XΛ^kX^{-1}\)
- 用\(u^k=A^ku_0=XΛ^kX^{-1}u_0=c_1(λ_1)^kx_1+...+c_n(λ_n)^kx_n\)求解\(u_{k+1}=Au_{k}\)
- 没有相等的特征值=\(X\)可逆且\(A\)能够对角化;存在相等的特征值=\(A\)可能有太少的线性无关(independent)特征向量。那么\(X^{-1}\)不存在。
- 每个矩阵\(C=B^{-1}AB\)都有与A相同的特征值。这些\(C\)与A相似。
注:\(Λ\)是\(λ\)的希腊文大写形式,意为\(λ\)存在于特征(值)矩阵\(Λ\)的对角线上。
相似矩阵
所有矩阵\(A=BCB^{-1}\)都是相似的。它们都共享 \(C\) 的特征值。但是,不是具有相同的特征值的矩阵都是相似矩阵。
如果两个矩阵相似,则它们具有相同的特征值和相同数量的独立特征向量(但可能不相同的特征向量)。
当我们对角化 \(A\) 时,我们会找到一个与 \(A\) 相似的对角矩阵(特征矩阵) \(Λ\)。
可见我们是利用相似矩阵的性质,然后将\(B、C\)分别换成特征向量矩阵\(X\)和特征矩阵\(Λ\)来进行矩阵对角化的,也就是相似对角化。
结论
- 所有存在n个不重复特征值的矩阵都能对角化。
- 可逆指的是特征值不为0;对角化指的是特征向量(对\(X\)来说太少或太多)。两者没有关系。
- 对应于n个不同特征值的特征向量\(x_1, ..., x_j\)应是线性无关的,才能对角化A。所有存在n个不重复特征值的矩阵都能对角化。
实对称矩阵(正交,二次型都是实对称矩阵)
写本篇时作者没有带考研书籍,可能不切合考研重点。
实对称矩阵(Symmetric Matrix)\(S\)有\(n\)个实特征值\(λ_i\)以及\(n\)个归一化正交的特征向量\(q_1,...,q_n\).
实对称矩阵是理论和应用中最重要的矩阵,它是一种特殊的与对角矩阵相似的矩阵。
- 实对称矩阵(Symmetric Matrix)只有实特征值。
- 实对称矩阵的特征向量可以归一化正交。
- 所有实特征矩阵都能对角化:\(S=QΛQ^{-1}=QΛQ^T\),注意因为实特征矩阵的特征向量归一化正交,也可以\(S=QΛQ^T\)。
- \(S\)的正特征值数等于正枢轴(pivot,化成行阶梯行最简式可得)数。二次型的正惯性系数和负惯性系数即特征值的正负个数,因为相似矩阵的性质。
因此有\(S=QΛQ^{-1}=QΛQ^T=λ_1q_1q_1^T+...+λ_nq_nq_n^T\)。
共轭对
正定矩阵
具有正特征值的对称矩阵称之为正定矩阵。例如:2x2矩阵S的满足\(a>0\)及\(ac-b^2>0\)正定。
可见,正定矩阵同时也具有正的主元。
注意前面提到的基本性质:
- \(n\)个特征值的积等于行列式
- \(n\)个特征值的和等于n个对角线元素的总和
- A的迹\(=\Sigma{a_{nn}}=\Sigma{λ}\)
基于能量的定义(二次型)
推导
\(Sx=λx\)
\(x^TSx=x^Tλx\)
译名问题
reduced row echelon form 译为 行最简型
pivot 译为 主元
ChangeLog
10月01日 21:46 完成特征值简介小节。下一章矩阵对角化将是很重要的内容,明天再写吧。
10月02日 10:46 完成相似矩阵与相似对角化章节。这里应注意将对角矩阵和相似矩阵应结合在一起看。
10月07日 12:35 实对称矩阵(二次型),下来写共轭对和正定矩阵。
10月22日 12:18 文章结束。转载请说明出处。
11月12日 16:41 修改了一些可能引起争议的描述