为了能到远方,脚下的每一步都不能少.|

园龄:粉丝:关注:

Introduction to Linear Algebra

第1章:向量介绍

1.1 向量与线性组合

向量加法:u+v=[u1+v1u2+v2un+vn]
标量乘法:cv=[cv1cv2cvn]
线性组合:cu+dv

示例:
u=[12]v=[34]
2u+3v=2[12]+3[34]=[2+94+12]=[1116]

1.2 向量的长度与点积

长度(范数):v=v12+v22++vn2
点积:uv=u1v1+u2v2++unvn
柯西 - 施瓦茨不等式:|uv|uv

示例:
u=[12]v=[34]
uv=1×3+2×4=3+8=11
u=12+22=5
v=32+42=25=5
验证柯西 - 施瓦茨不等式:|11|5×5=2511.18

1.3 矩阵

矩阵加法:元素 - wise
矩阵乘法:行与列的点积
转置:交换行和列

示例:
A=[1324]B=[5768]
A+B=[610812]
AB=[19224350]
AT=[1234]

第2章:求解线性方程组

2.1 向量与线性方程

线性方程组:一组可以同时求解的线性方程
增广矩阵:系数矩阵加上常数向量

示例:
方程组:
{x1+2x2=32x1+3x2=5
增广矩阵:
[123235]

2.2 消元的概念

消元:通过行变换简化方程组,目标是将增广矩阵化为上三角形式
回代:从上三角形式的矩阵中求解变量

示例:
从增广矩阵开始:
[123235]
使用第1行消去第2行的 x1
R2=R22R1
[103011]
通过回代求解:
从第2行:x2=1x2=1
从第1行:x1+2(1)=3x1=1
所以,x=[11]

2.3 用矩阵进行消元

LU分解:将 A 分解为 LU,使得 A=LU

示例:
A=[1223]
执行消元:
L=[1201]
U=[1021]
验证:
LU=[1201][1021]=[1223]=A

2.4 矩阵运算规则

加法和数乘:元素 - wise
乘法:行与列的点积
转置:交换行和列
逆矩阵:对于可逆矩阵 A,存在 A1 使得 AA1=I

示例:
A=[1324] 的逆矩阵。
首先,计算行列式:
det(A)=1×42×3=46=2
然后,
A1=1det(A)[4321]=[21.510.5]
验证:
AA1=[1×(2)+2×1.51×1+2×(0.5)3×(2)+4×1.53×1+4×(0.5)]=[1001]=I

2.5 逆矩阵

逆矩阵:如果 A 是可逆的,那么 Ax=b 的解就是 x=A1b

示例:
给定 A=[1324]b=[511]
x
首先,找到 A1
A1=[21.510.5]
然后,
x=A1b=[21.510.5][511]=[2×5+1×111.5×5+(0.5)×11]=[10+117.55.5]=[12]
验证:
Ax=[1×1+2×23×1+4×2]=[1+43+8]=[511]=b

2.6 消元=分解:A=LU

LU分解:将 A 分解为 LU,使得 A=LU

示例:
A=[231456789]
执行消元:
使用第1行消去第2行和第3行的 x1
R2=R22R1[44,56,62]=[0,1,4]
R3=R33.5R1[77,810.5,93.5]=[0,2.5,5.5]
现在,A 看起来是:
[23101402.55.5]
使用第2行消去第3行的 x2
首先,将第2行缩放以使 x2 的系数为1:R2=1×R2[0,1,4]
然后,R3=R3+2.5R2[0,2.5+2.5,5.510]=[0,0,4.5]
最终的 U 矩阵:
U=[231014004.5]
L 矩阵包含用于消元的乘数:
L=[1002103.52.51]
验证:
LU=[123.5012.5001][231014004.5]

计算:
第1行:
1×2+0×0+0×0=2
1×3+0×1+0×0=3
1×1+0×4+0×4.5=1

第2行:
2×2+1×0+0×0=4
2×3+1×1+0×0=6+1=7
2×1+1×4+0×4.5=24=2

第3行:
3.5×2+(2.5)×0+1×0=7
3.5×3+(2.5)×1+1×0=10.52.5=8
3.5×1+(2.5)×4+1×4.5=3.5+104.5=9

因此,
LU=[231456789] (原文档此处计算有误,经修正后符合)

第3章:向量空间和子空间

3.1 向量空间

向量空间:满足加法和数乘封闭性的集合

3.2 矩阵的零空间

零空间:满足 Ax=0 的所有向量 x 的集合

示例:
A=[1224]
求其零空间。
解方程 Ax=0
{x1+2x2=02x1+4x2=0
由第一个方程 x1=2x2,代入第二个方程成立,所以零空间是:
Null(A)={[2x2x2]x2R}=span([21])

3.3 Ax=b 的完整解

完整解:线性方程组 Ax=b 的解可以表示为特解加上零空间中的向量

公式:
如果 xpAx=b 的一个特解,那么完整解为:
x=xp+xh
其中 xhNull(A)

示例:
对于方程组 Ax=[35],其中 A=[1223],我们之前已经求得特解 xp=[11],零空间是 span([21]),所以完整解为:
x=[11]+t[21]=[12t1+t],tR

3.4 独立性、基和维度

  • 线性独立:一组向量中没有任何一个向量可以表示为其他向量的线性组合
  • :一组线性独立的向量,它们的线性组合可以生成整个向量空间
  • 维度:基向量的个数

判断线性独立的方法:
设有一组向量 {v1,v2,,vk},如果方程 c1v1+c2v2++ckvk=0 只有平凡解 c1=c2==ck=0,则这组向量线性独立

示例:
向量 [10][01] 是线性独立的,因为 c1[10]+c2[01]=[c1c2]=[00] 只有 c1=c2=0 这个解

3.5 四个子空间的维度

  • 列空间:矩阵 A 的所有列向量的线性组合生成的空间,记作 Col(A)
  • 行空间:矩阵 A 的所有行向量的线性组合生成的空间,记作 Row(A)
  • 零空间:同上
  • 左零空间:矩阵 AT 的零空间,即 Null(AT)

维度关系:
dim(Col(A))=rank(A)
dim(Row(A))=rank(A)
dim(Null(A))=nrank(A)(如果 Am×n 矩阵)
dim(Null(AT))=mrank(A)

示例:
对于矩阵 A=[123246],其秩 rank(A)=1,因为第二列是第一列的两倍,第三行是第一行的三倍。
列空间的维度是 1
行空间的维度也是 1
零空间的维度是 21=1
左零空间的维度是 31=2

第4章:正交性

4.1 四个子空间的正交性

正交子空间:如果两个子空间的任意两个向量都是正交的,则这两个子空间是正交的。

4.2 正交投影

投影公式:向量 b 在子空间 V 上的投影可以表示为 projVb=(v1b)v1++(vkb)vk,其中 {v1,,vk}V 的正交基。

示例:
u=[12] 是正交基,b=[34],则:
p=1×3+2×412+22[12]=115[12]=[115225]

子空间投影


目标:将向量 bRm 投影到由矩阵 ARm×n 的列空间 Col(A) 上,找到投影向量 p 和投影矩阵 P

几何意义:

  • 投影 pCol(A) 中离 b 最近的向量(欧氏距离最短)。
  • 误差向量 e=bp 垂直于 Col(A)

二、数学推导与矩阵形式

  1. 投影向量的表达式
  • 假设:投影 p=Ax,其中 xRn 为系数向量。
  • 正交条件:误差向量 eCol(A) 正交,即:

    A(bAx)=0.

  • 正规方程(Normal Equation):

    AAx=Ab.

  • 解:若 AA 可逆(当 A 列满秩时成立),则:

    x=(AA)1Ab.

  • 投影向量:

    p=Ax=A(AA)1Ab.

  1. 投影矩阵的构造
  • 定义:将 p=Pb,则投影矩阵为:

    P=A(AA)1A.

  • 关键性质:
    1. 幂等性:P2=P(多次投影结果不变)。
    2. 对称性:P=P(几何对称性的代数体现)。
    3. 秩:rank(P)=rank(A)(投影矩阵秩与子空间维度一致)。
    4. 作用效果:对任意 vRmPvCol(A)
  1. 正交补空间的投影矩阵
  • 到正交补空间 Col(A) 的投影矩阵为:

    P=IP.

  • 验证:
    • Pb=bp=e(残差向量)。
    • P2=P(幂等性保持)。

特例分析:一维投影
场景:若 A 的列空间为一条直线(即 A=aRm):

  • 投影矩阵:

    P=aaaa.

  • 投影向量:

    p=abaaa.

  • 几何解释:标量系数 aba2 表示 ba 方向上的缩放比例(类比向量点积的几何意义)。

应用实例:最小二乘法

  1. 线性回归问题
  • 目标:拟合数据点 (xi,yi) 到直线 y=c0+c1x
  • 矩阵形式:

    A=(1x11x21xm),b=(y1y2ym).

  • 最优解:

    c=(AA)1Ab.

  1. 投影视角
  • 最小二乘解等价于将 b 投影到 Col(A),使得残差平方和 e2 最小。
  • 物理意义:通过投影消除数据噪声,找到最佳拟合直线。

几何与代数的统一性总结

视角 几何意义 代数形式
投影向量 子空间中离原向量最近的点 p=Pb
误差向量 与原子空间正交的残差 e=(IP)b
最小二乘 最小化残差平方和 minx|Axb|2
矩阵性质 幂等性、对称性、秩与子空间维度一致 P2=P,P=P

4.3 最小二乘逼近

最小二乘法:在超定系统 Ax=b 中,最小化 Axb2 的解称为最小二乘解。

公式:
最小二乘解满足 ATAx=ATb

示例:
A=[101011]b=[123],求最小二乘解。
先计算 ATAATb
ATA=[100111][101011]=[2112]
ATb=[100111][123]=[45]
解方程 ATAx=ATb
[2112][x1x2]=[45]
使用公式或高斯消元法求解,得到:
x=[2353]

4.4 格拉姆 - 施密特正交化过程

格拉姆 - 施密特过程:将一组线性独立的向量转化为正交(或标准正交)向量。

步骤:
给定向量 v1,v2,,vk,构造正交向量 u1,u2,,uk
u1=v1
u2=v2proju1v2
u3=v3proju1v3proju2v3
依此类推。

示例:
v1=[10]v2=[11]
u1=v1=[10]
proju1v2=1×1+0×112+02[10]=[10]
u2=v2proju1v2=[11][10]=[01]
现在得到正交基 [10][01],它们也是标准正交的。

第5章:行列式

5.1 行列式的性质

行列式:行列式是一个标量函数,定义在方阵上,反映矩阵的某些特性,如是否可逆。

性质:

  • 行列式为零当且仅当矩阵是奇异的(不可逆的)。
  • det(AT)=det(A)
  • det(AB)=det(A)det(B)

对于 2×2 矩阵:
det[abcd]=adbc

5.2 行列式和体积

行列式:行列式的绝对值表示线性变换对体积的缩放因子。

5.3 行列式的计算

  • 余子式和代数余子式

    • 余子式 Mij:删除第 i 行第 j 列后得到的子矩阵的行列式。
    • 代数余子式 CijCij=(1)i+jMij
  • 按行或列展开

    • det(A)=j=1naijCij(按第 i 行展开)
    • det(A)=i=1naijCij(按第 j 列展开)

示例:
计算 3×3 矩阵 A=[147258369] 的行列式。
按第一行展开:
det(A)=1C11+2C12+3C13

计算代数余子式:
C11=(1)1+1det[5869]=1(5×96×8)=4548=3
C12=(1)1+2det[4769]=1(4×96×7)=(3642)=6
C13=(1)1+3det[4758]=1(4×85×7)=3235=3

代入:
det(A)=1×(3)+2×6+3×(3)=3+129=0
所以,det(A)=0,说明 A 是奇异的。

第6章:特征值和特征向量

6.1 特征值和特征向量

特征值方程:Av=λv,其中 λ 是特征值,v 是特征向量。
特征方程:
det(AλI)=0

示例:
考虑矩阵 A=[2112]
特征方程:
det[2λ112λ]=(2λ)21=λ24λ+3=0
解得 λ1=1λ2=3

求特征向量:
对于 λ1=1
解方程 (AI)v=0
[1111][v1v2]=[00]
得到 v1+v2=0,所以特征向量可以是 [11]

对于 λ2=3
解方程 (A3I)v=0
[1111][v1v2]=[00]
得到 v1+v2=0v1=v2,所以特征向量可以是 [11]

6.2 对角化


矩阵对角化的核心目标是将一个 n×n 矩阵 A 通过相似变换转化为对角矩阵 D,即寻找可逆矩阵 P 和对角矩阵 D,使得:

P1AP=D或等价地A=PDP1.

这一过程的意义在于简化矩阵的运算(如幂运算、指数函数等),并揭示矩阵的深层结构。


推导过程

  1. 特征值与特征向量的引入
    矩阵对角化的前提是 A 具有足够的线性无关特征向量。假设 An 个线性无关的特征向量 v1,v2,,vn,对应特征值 λ1,λ2,,λn,即:

    Avi=λivi(i=1,2,,n).

  2. 构造可逆矩阵 P
    将特征向量 v1,v2,,vn 作为列向量构造矩阵 P

    P=[v1v2vn].

    由于 v1,v2,,vn 线性无关,矩阵 P 可逆。

  3. 验证 AP=PD
    计算矩阵乘积 AP

    AP=A[v1v2vn]=[Av1Av2Avn].

    根据特征方程 Avi=λivi,可得:

    AP=[λ1v1λ2v2λnvn].

    另一方面,构造对角矩阵 D=diag(λ1,λ2,,λn),则:

    PD=[v1v2vn](λ1000λ2000λn)=[λ1v1λ2v2λnvn].

    因此,AP=PD

  4. 导出对角化公式
    由于 P 可逆,对等式 AP=PD 左乘 P1,得到:

    P1AP=D.

    这即是对角化公式。

可对角化条件
矩阵 A 可以对角化,当且仅当 An 个线性独立的特征向量。数学公式前后均已添加 $ 符号标记。

示例:
继续使用 A=[2112],我们已经找到特征向量 [11][11],它们线性独立。
所以,A 可以对角化。
P=[1111]D=[1003]

计算 P1
det(P)=1×11×(1)=2
P1=12[1111]

验证 A=PDP1
PDP1=[1111][1003]12[1111]=[1313]12[1111]=[2112]

6.3 对称矩阵和正定矩阵

对称矩阵:满足 A=AT

性质:

  • 所有特征值都是实数。
  • 可以对角化,并且存在正交矩阵 Q 使得 A=QΛQT,其中 Λ 是特征值的对角矩阵。

正定矩阵:对称矩阵 A 是正定的,如果对于所有非零向量 x,有 xTAx>0

性质:
所有特征值都是正数。

示例:
矩阵 A=[3113] 是对称的。
计算特征值:
det(AλI)=det[3λ113λ]=(3λ)21=λ26λ+8=0
解得 λ1=2λ2=4,都是正数,所以 A 是正定的。

第7章:奇异值分解(SVD)

7.1 SVD的介绍

SVD定义:任何 m×n 矩阵 A 都可以分解为 A=UΣVT,其中:

  • Um×m 正交矩阵。
  • Σm×n 对角矩阵,对角线上的元素 σ1σ2σr>0 是奇异值。
  • Vn×n 正交矩阵。

几何意义:

  • UV 分别表示在域空间和值域空间中的旋转或反射。
  • Σ 表示在主方向上的缩放。

示例:
A=[100010]
则:
U=[100010001]Σ=[100010]V=[1001]
显然,A=UΣVT

7.2 SVD的应用

  • 主成分分析(PCA):通过SVD可以降维数据,提取最重要的特征方向。
  • 图像压缩:通过保留前几个奇异值,可以近似原矩阵,达到压缩的效果。
  • 推荐系统:利用SVD可以发现用户和物品之间的潜在关系。

示例(PCA):
假设有一组二维数据点 {x1,x2,,xn},我们希望将其降维到一维。

  • 计算数据点的均值 μ=1ni=1nxi
  • 计算协方差矩阵 C=1n1i=1n(xiμ)(xiμ)T
  • C 进行SVD分解,得到主成分方向(即 V 矩阵的第一列)。
  • 将数据投影到主成分方向上,得到降维后的数据。

第8章:线性变换

8.1 线性变换的定义

线性变换 T:VW 满足:

  • T(u+v)=T(u)+T(v)
  • T(cv)=cT(v)

示例:
旋转变换 R:R2R2,旋转角度为 θ,定义为:
R([xy])=[cosθsinθsinθcosθ][xy]
验证线性性:

  • R(u+v)=R(u)+R(v)
  • R(cv)=cR(v)

8.2 线性变换的矩阵表示

矩阵表示:选取 VW 的基后,线性变换可以用矩阵表示。

示例:
考虑线性变换 T:R2R2,定义为 T([xy])=[2x+yx+3y]
选用标准基 {[10],[01]},则:
T([10])=[21]T([01])=[13]
所以,T 的矩阵表示是:
A=[2113]

8.3 寻找合适的基

选择合适的基:选择合适的基可以简化线性变换的矩阵表示,例如对角化。

示例:
考虑对称矩阵 A=[2112]
我们已经知道其特征向量是 [11][11],特征值分别是 13
如果选择这组特征向量作为基,则 A 在这个基下的矩阵表示是:
D=[1003]
这样,线性变换的表示更加简洁。

第9章:复向量和矩阵

9.1 复数

复数表示:复数表示为 a+bi,其中 i2=1
复数运算:加法、乘法和共轭运算。

示例:
z1=1+2iz2=3i,则:

  • z1+z2=(1+3)+(21)i=4+i
  • z1z2=(1)(3)+(1)(i)+(2i)(3)+(2i)(i)=3i+6i2i2=3+5i+2=5+5i
  • z1¯=12i

9.2 厄米特矩阵和酉矩阵

  • 厄米特矩阵:满足 A=AH,其中 AH 是共轭转置。
  • 酉矩阵:满足 AHA=I

示例:
A=[1ii1],计算 AH
AH=[1ii1]
验证 A 是否为厄米特矩阵:
AH=A,所以 A 是厄米特矩阵

9.3 快速傅里叶变换(FFT)

DFT公式:对于长度为 n 的复数序列 x0,x1,,xn1,其DFT为:
Xk=j=0n1xje2πijkn,k=0,1,,n1

应用:
信号处理、图像处理、音频处理等领域。

示例:
计算长度为 4 的序列 x=[1,2,3,4] 的DFT:

  • X0=1+2+3+4=10
  • X1=1+2e2πi4+3e4πi4+4e6πi4=1+2eiπ2+3eiπ+4e3iπ2=1+2(0i)+3(1)+4(0+i)=12i3+4i=2+2i
  • X2=1+2e4πi4+3e8πi4+4e12πi4=1+2eiπ+3e2iπ+4e3iπ=1+2(1)+3(1)+4(1)=12+34=2
  • X3=1+2e6πi4+3e12πi4+4e18πi4=1+2e3iπ2+3e3iπ+4e9iπ2=1+2(0+i)+3(1)+4(0i)=1+2i34i=22i

所以,DFT结果是 X=[10,2+2i,2,22i]

第10章:线性代数的应用

10.1 图和网络

邻接矩阵:描述图中节点之间的连接关系。

应用:通过矩阵运算分析图的结构,如节点的度、路径长度等。

示例:
设邻接矩阵A=[011101110]

计算A2
A2=[011101110][011101110]=[211121112]

(A2)ij表示从节点i到节点j的长度为2的路径数,例如(A2)12=1表示从节点1到节点21条长度为2的路径。

10.2 工程中的矩阵

有限元方法:在结构工程中,刚度矩阵用于模拟结构的行为。

示例:
设刚度矩阵K=[kkkk]

求解系统的位移时,需要求解方程Ku=f,其中f是力向量。

10.3 马尔可夫矩阵

马尔可夫矩阵:每个元素表示状态转移的概率,每一行的和为1

应用:建模随机过程,如人口迁移、网页排名等。

示例:
设马尔可夫矩阵P=[0.70.30.40.6]

稳态概率π满足πP=ππ1+π2=1

解方程:
{0.7π1+0.4π2=π10.3π1+0.6π2=π2

结合π1+π2=1,解得:π1=47π2=37

10.4 线性规划

线性规划问题:最小化或最大化线性目标函数cTx,在满足线性约束Axbx0的条件下。

应用:资源分配、生产计划、成本最小化等。

示例:
最大化z=3x1+2x2

约束条件:
{x1+x242x1+x25x1,x20

通过图解法或单纯形法求解,找到可行区域的顶点,计算目标函数值,得到最优解。

10.5 傅里叶级数

傅里叶级数:将周期函数表示为正弦和余弦函数的线性组合。

公式:
f(x)=a02+n=1(ancos(nx)+bnsin(nx))

其中:
an=1πππf(x)cos(nx)dxbn=1πππf(x)sin(nx)dx

示例:
计算方波函数的傅里叶级数。设f(x)是周期为2π的方波函数,定义为:
f(x)={1,0<x<π1,π<x<0

计算anbn
an=0bn={4nπ,n 奇数0,n 偶数

所以,傅里叶级数为:
f(x)=4π(sin(x)+13sin(3x)+15sin(5x)+)

10.6 计算机图形学

变换矩阵:用于表示图形的平移、旋转、缩放等变换。

示例:
二维旋转矩阵:
R(θ)=[cosθsinθsinθcosθ]

平移矩阵:
T(a,b)=[10a01b001]

10.7 密码学

希尔密码:使用矩阵进行文本的加密和解密。

示例:
设加密矩阵E=[1234]

将文本 "HI" 转换为数字对[7,8]

加密:
[1234][78]=[2353]

取模26
[23mod2653mod26]=[231]

对应字母 "XD"。

解密需要E的逆矩阵。计算E1
det(E)=1×42×3=2
E1=12[4321]=[21.510.5]

在模26下,需要找到整数逆元。这里简化示例,实际应用会选择更合适的矩阵。

第11章:数值线性代数

11.1 高斯消元法的数值稳定性

问题:在计算机实现高斯消元法时,由于舍入误差,可能会导致结果不准确。

解决方案:

  • 主元选择:选择最大的元素作为主元,减少舍入误差。
  • 部分主元法:只在列内交换行。
  • 完全主元法:在整个矩阵中选择最大的元素作为主元。

示例:
考虑病态矩阵A=[1223.0001],求解Ax=[35.0001]

通过主元选择,可以改善数值稳定性。

11.2 范数和条件数

  • 范数:衡量向量或矩阵的“大小”。
  • 条件数:衡量矩阵求逆或线性方程组求解对数据误差的敏感度。

公式:
κ(A)=AA1

示例:
计算矩阵A=[100ϵ]的条件数,其中ϵ很小。
A2=1A12=1ϵ

所以,κ(A)=1ϵ,当ϵ很小时,条件数很大,矩阵是病态的。

11.3 迭代方法

  • 共轭梯度法:用于求解对称正定矩阵的线性方程组。
  • 幂迭代法:用于求解矩阵的主特征值和特征向量。

示例(共轭梯度法):
考虑求解Ax=b,其中A=[2112]b=[11]

初始猜测x0=[00],计算残差r0=bAx0=b

p0=r0

计算α0=r0Tr0p0TAp0=1

更新x1=x0+α0p0=[11]

计算新的残差r1=r0α0Ap0=[00]

因为残差为零,停止迭代,解为x=[11]

第12章:线性代数在概率和统计中的应用

12.1 基本概念

均值、方差、协方差:使用向量和矩阵表示数据集的统计量。

示例:
设数据集{x1,x2},其中x1=[12]x2=[34]

均值:
μ=12(x1+x2)=[23]

协方差矩阵:
C=[2222]

12.2 多元高斯分布

高斯分布的矩阵形式:
f(x)=1(2π)n/2|Σ|1/2exp(12(xμ)TΣ1(xμ))

示例:
x=[x1x2]μ=[00]Σ=[1001],则:
f(x)=12πexp(12(x12+x22))

12.3 最小二乘法

数据拟合:使用最小二乘法在给定数据集上拟合线性模型。

公式:
w=(XTX)1XTy

示例:
给定数据集{(x1,y1),(x2,y2)},其中x1=[12]y1=3x2=[34]y2=5

设计矩阵:
X=[1324]y=[35]

计算:
XTX=[10141420]XTy=[1826]

解方程(XTX)w=XTy
[10141420][w1w2]=[1826]

可以使用高斯消元法或矩阵求逆求解w

本文作者:归游

本文链接:https://www.cnblogs.com/guiyou/p/18698897

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   归游  阅读(8)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
收起