2.2 Projections onto Subspaces 阅读笔记

投影

reference的内容为唯一教程,接下来的内容仅为本人的课后感悟,对他人或无法起到任何指导作用。

Reference

  1. Course website: Projections onto Subspaces | Unit II: Least Squares, Determinants and Eigenvalues | Linear Algebra | Mathematics | MIT OpenCourseWare
  2. Course video: 【完整版-麻省理工-线性代数】全34讲 配套教材_哔哩哔哩_bilibili
  3. Course summary: Lecture 15: Projections onto subspaces (mit.edu)

这一讲来解释为什么上一讲里面解求 Ax=b 的近似解要变成 ATAx^=ATb。这里涉及了投影 (Projection) 的概念,因此需要解释一下。

首先先回顾一下最熟悉的平面直角坐标系下的投影。

image-20220307120322393

a 是二维空间中过原点的一个 subspace,想求直线上距离 b 点最近的点,显然需要作垂线得到垂足 p,即为最近的点。此时向量 p 就是向量 b 在子空间直线上的投影。

高中的时候要求投影向量 p 的话印象里是先 ||b||cosθa||a||,相当于投影向量的模乘 a 方向的单位向量。上下同乘 a 的模得到:

||a||||b||cosθ||a||a||a||=ab||a||a||a||

三角函数看起来总是不那么简洁,这一节将用矩阵的形式来阐述投影,同样从二维开始。再解释求近似解和投影的关系,最后给出一般性的投影公式和最小二乘法简单应用。

Two Dimension

此时有一个误差向量 e,方向从 p 到 b,e=b-p。

image-20220307114252142

这里体现出了正交性,e ⊥ a,即:

aT(bp)=0

p=ax^,则有:

aT(bax^)=0aTb=aTax^

因此有:

x^=aTbaTap=aaTbaTa

其实和上面的高中版本等价。

分析这个式子发现 a 在给定直线的时候任取直线内一点(一个向量),p 都是不会变的,因为就相当于给原来的 a 加个系数,上下同乘系数的平方,消了,不过 b 要是数乘一个倍数投影向量 p 也会同乘相同系数。这说明投影向量只和被投影的向量 b 和 给的直线有关,和直线内的向量 a 无关。

Projection Matrix

对 p 进行一下结合律:

p=aaTbaTa=aaTaTab=Pb

于是有:

P=aaTaTa

为投影矩阵。

这个矩阵有什么性质呢?

  • PT=P:显然。
  • rank(P)=1:1.12 中已经提到,列向量乘行向量会得到秩 1 矩阵,此外 P 的列空间是什么呢?列向量的线性组合的张成空间,即 Pb 的张成空间,也就是投影向量 p 所在的空间了,是直线啊,维度为1因此秩为1.
  • P2=P:因为对一个向量往一条直线上投影两次和投影一次是一样的啊。

Why Project?

为什么要投影呢,这和求 Ax=b 的近似解有关系。

为什么 Ax=b 无解?因为 b 不在 A 的列空间。

如果把 b 投影到 A 的列空间得到 p,就可以解近似的方程 Ax^=p 了,怎么求 p 呢?涉及到高维空间的投影了,下面来研究。

Higher Dimensions

以 3 维为例推导公式。

假设我们要求三维空间的一个向量 b 在二维平面上一个投影 p,二维平面有两个基向量 a1,a2。看起来像这样:

image-20220307132849951

这个平面便是 A=[a1a2] 的列空间。

仍然有 e ⊥ ai,i = 1 和 2,即:

a1T(bp)=0a2T(bp)=0

用矩阵形式合并得:

AT(bp)=0

这里设 p=a1x^1+a2x^2=Ax^,于是有:

AT(bAx^)=0ATb=ATAx^=ATp

这时我们发现向量 e 的空间就是 A 的左零空间,即 eN(AT),我们已经知道了左零空间与列空间正交,因此向量 e 也与列空间正交,这和我们的直观是对应的。

上一讲提到 rank(ATA)=rank(A)这里已经假设了 a1 和 a2 是二维平面的基,因此独立,A 列满秩,因此 ATA 可逆,故得 x^

x^=(ATA)1ATbp=A(ATA)1ATb=Pb

投影矩阵 P:

P=A(ATA)1AT

如果 A 是可逆方阵,p=a1x^1+a2x^2=Ax^,向量 p 所在空间为整个空间,说明向量 b 被投影到整个空间,那也就是它自己了,Pb=b,一计算此时P=I。但是通常 A 不是方阵,根本不可逆。

给出两点比较容易证的性质:

  • PT=P
  • P2=P

Least Squares Fitting A Line

现在来简单应用一下投影——最小二乘法,我们经常需要拟合直线:

image-20220307160338773

三个点坐标 (1,1) (2,2) (3,2) 显然不在一条直线上。

可以用 y=C+Dx 拟合,因此需要解方程:

C+D=1C+2D=2C+3D=2

表示成 Ax=b 显然无解:

[111213][CD]=[122]

于是需要把 b 投影到 A 的列空间得到投影向量 p,解 Ax^=pATAx^=ATb=ATp

x^=(ATA)1ATb=[2312]

因此拟合直线:y=23+12x

posted @   WIND_LIKE  阅读(65)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
Live2D
欢迎阅读『2.2 Projections onto Subspaces 阅读笔记』
点击右上角即可分享
微信分享提示