行百里
|

某宇_My

园龄:3年2个月粉丝:0关注:5

统计模型与推断II 课程2

1 线性代数回顾

详见A.1&A.2部分。

  • 内积 u,v=uTv=iuivi
  • 欧几里得范数2 -范数:|v|2=vTv
  • 向量 vj,jS 的线性张成:L(vj,jS)=jcjvj:cjR
  • Rn 到子空间 V=L(vj,jS) 的正交投影:

    P(y|V)=argminvVyv22

  • 子空间 V 的正交补:

    V={u:P(u|V)=0}

  • 协方差算子:

    Cov(U,W)=E[U(WE[W])T],Var(U)=Cov(U,U)

  • 二次型(作业):如果 ϵ 的均值为 μ 且方差为 Σ,则

    E[ϵTΛϵ]=μTΛμ+Tr(ΣΛ)

2 广义逆

2.1 动机:最小二乘问题

假设我们给定响应向量 yRN 和设计矩阵 XRN×p 。设 bRp 为固定但未知的参数。在没有进一步假设的情况下,我们总是可以写成:

y=Xb+(yXb)=Xb+e,

如果我们定义 e=yXb,那么这与一般线性模型有什么不同?

从逼近的角度来看,最小化一种“逼近误差”形式是有意义的。选择此类误差度量的一个选项是平方距离:

Q(b)=(yXb)T(yXb)=yXb2

最小化 Q 的解称为最小二乘解(估计量)。写作

Qb=[Qb1Qbp]

当梯度向量 Qb 被设置为0时,Q 达到最小值。虽然你可以通过求解梯度微分来得到矩阵-向量微分公式,但我们将使用已知的矩阵-向量微分公式来推导梯度。

引理 2.1

对于任意 aRpARp×p

(i) aTxx=a

(ii) xTAxx=(A+AT)x

应用引理 2.1:

Qb=2XTXb2XTy.

通过求解 Qb=0,我们得到常规方程:

XTXb=XTy

我们将从线性方程组的角度来研究它。

2.2 广义逆

为了研究常规方程,重要的是要对求解线性方程组有一个一般的理解:

Ax=c,

其中 xRncRmARm×n 。如果 A 是非奇异的(这也意味着 m=n),则其逆 A1 存在,因此 x=A1c 是唯一解。在这一类中,A 不总是非奇异的。为了仍然能够系统地研究常规方程,我们引入了广义逆。

定义 2.2

矩阵 A 的广义逆是任何满足 AGA=A 的矩阵 G

定理 2.3

对于任意矩阵 A,存在非奇异矩阵 PQ 使得

A=P[D000]Q,

(2.1)

其中 D 是一个非奇异的 r×r 对角矩阵,且 r=rank(A) 。矩阵

G=Q1[D1FHB]P1,

其中 FHB 是适当维度的任意矩阵,满足 AGA=A

定理 2.3 表明,任意矩阵 A 都有广义逆,且除非 A 是非奇异的,A 可能有无穷多个广义逆。如果 A 是非奇异的,它有唯一的广义逆,即 A1 。此外,定理 2.3 提示了一种计算广义逆的方法,该方法给定了分解(2.1)后。一个特殊且有用的情况称为奇异值分解(SVD)。

定理 2.4 (SVD)

对于任意矩阵 ARm×n,若其秩为 r,则存在 U1Rm×rU2Rm×(mr)D1Rr×rV1Rn×rV2Rn×(nr),使得

A=UD~VT:=[U1U2][D000][V1V2]T

其中 UTU=ImVTV=In,且 D=diag{d1,,dr},并且 d1d2dr>0

注意,SVD 并不是唯一的。例如,可以将 UV 分别替换为 UV 。有趣的是,可以很容易地验证 G=VD+UT 满足 AGA=A,无论是直接通过定理 2.3,还是通过 SVD 来得到。

显然,如果 A=0m,n,那么 VD~+UT=0n,m 。否则,VD~+UT=V1D1U1T,这更易于计算。

由于 SVD 在大多数线性代数包中都有实现,因此可以直接应用 SVD 来获得广义逆的版本 G=VD+UT 。例如,R 语言中的函数 ginv() 就应用了 SVD 来计算广义逆:

library(MASS)
A <- matrix(1:9, nr=3, nc=3)

Ai <- ginv(A)
A %*% Ai %*% A  # 验证

res <- svd(A)  # 化简形式
Ai2 <- res$u %*% diag(1/res$d) %*% t(res$v)  # 计算广义逆
A %*% Ai2 %*% A  # 验证

2.3 Moore-Penrose 广义逆

定理 2.5

对于任意矩阵 A,存在唯一的矩阵 A+,满足以下四个性质:

(i) AA+A=A

(ii) A+AA+=A+

(iii) A+A 是对称的

(iv) AA+ 是对称的

满足上述四个性质的矩阵 A+ 称为 A 的 Moore-Penrose 广义逆。你可以验证我们上面对 D~+ 的定义确实是 D~ 的 Moore-Penrose 广义逆。注意,证明表明 A+ 可以通过 SVD 来计算,这与我们之前讨论的广义逆相吻合。

2.4 投影矩阵

我不打算涵盖线性代数的基础知识。你可以参考Monahan(2008)的附录A.1-2进行快速复习。这里我将列出一些重要的定义和结果。你可以在Monahan(2008)中找到相关的证明。

定义 2.6

矩阵 A 的秩 rank(A) 是其独立行或列的数量。其列空间 C(A) 定义为由 A 的列所张成的向量空间。即:

{x:存在向量 c 使得 x=Ac}

它的零空间 N(A) 定义为空间 x:Ax=0 。向量空间 V 的维度 dim(V)V 基的向量数目。

定理 2.7

(Monahan 2008年,定理A.1) 如果 ARm×n,则

dim(N(A))+dim(C(A))=n

定义 2.8

两个向量空间 VS 被称为在 Rm 中的正交补,如果且仅如果 V,SRmVS=0 ,且对于任意 vV,sSvTs=0

定理 2.9

(Monahan 2008年,结果A.4) 如果 VSRm 中的正交补,则任意向量 xRm 可以表示为:

x=v+s

其中 vV,sS,且该分解是唯一的。

定理 2.10

(Monahan 2008年,结果A.5)如果 ARm×n,则 C(A)N(AT)Rm 的正交补。

定理 2.11

(Monahan 2008年,结果A.6)设 V1S1 是正交补,并且 V2S2 也是正交补。如果 V1V2,则 S2S1

定义 2.12

一个方阵 P 被称为幂等矩阵,当且仅当 P2=P

定义 2.13

一个方阵 P 被称为是投影矩阵,投影到向量空间 V 上,当且仅当:

(i) P 是幂等的。

(ii) 对于任何 xPxV

(iii) 对于任何 xVPx=x

推论 2.14

任何幂等矩阵都是投影到其列空间 C(P) 上的投影矩阵。

定理 2.15

AA 是投影到 C(A) 上的投影。

显然,AA 并不是唯一的投影到 C(A) 上的投影矩阵,因为可能存在 A 的不唯一性。现在,我们使用投影的概念来理解解的几何形状。回想一下,对于一致的系统 Ax=c,解的通用形式为 x=Ac+(IAA)z,其中 z 为任意向量。注意到 A(IAA)z=0,因为 A(IAA)=0 。也就是说,(IAA)zN(A) 对于任意的 z 。这并不巧合,下面的定理确实显示了 IAA 是投影到 N(A) 上的投影。

定理 2.16

IAA 是投影到 N(A) 上的投影矩阵。

示例 1

考虑矩阵 A=[1,1]T 。因此,C(A) 包含了所有在直线 y=x 上的点,即通过原点的斜率为1的直线。

为了找到一个广义逆 G=[u,v],我们利用以下性质:

AGA=A

这导致 v=1u 。因此,Gu=[u,1u] 是矩阵 A 的广义逆,对于任意的 u 。定理 2.15 表明,AGu 是投影到 C(A) 上。举个例子,设 x=[2,1]T

AG0x=[0101][21]=[11]C(A)

AG1x=[1010][21]=[22]C(A)

引理 2.17 (作业)

如果 Ax=Bx 对所有 x 都成立,则 A=B

引理 2.18 (作业)

对于任意矩阵 X,如果 trace(XTX)=0,则 X=0

定理 2.19 (作业)

一个对称且幂等的矩阵 P,如果它投影到向量空间 V 上,则它是唯一的。

这个唯一的投影矩阵与正交投影有密切关系。

推论 2.20

假设 P 是对称且幂等的矩阵,投影到 V 上。则 IP 是一个投影到 V 的正交补的对称且幂等的投影矩阵。

显然,唯一的对称投影矩阵是非常理想的,因为它是一个正交投影。通过之前的探索,我们知道 AA 是一个投影到 C(A) 上的投影矩阵。那么,是否有办法得到唯一的对称投影矩阵到 C(A) 上呢?根据定理 2.19,我们可以尝试找到一个 A,使得 AA 是对称的。而 Moore-Penrose 广义逆可以达到这个目的。

推论 2.21

AA 是唯一的对称投影矩阵,投影到其 C(A) 上。

UD~VT 为矩阵 A 的 SVD,如定理 2.4 所述,AA+=UD~VTVD~+UT=U1U1T,这个可以用来计算 AA+

示例 2(示例 1 继续)

通过计算机程序 A+=[0.5,0.5]T 。根据推论 2.21,AA+ 是投影到 C(A) 上的唯一对称投影矩阵。

为了验证,

AA+=[0.50.50.50.5]

确实是一个对称矩阵。现在,设 x=[2,1]T,则

AA+x=[1.51.5]

这表示 x 投影到直线 y=x 上的正交投影。

作业

A.2, A.3, A.5, A.6, A.9

本文作者:某宇_My

本文链接:https://www.cnblogs.com/Desire-My/p/18723915

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   某宇_My  阅读(8)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
/*粒子线条,鼠标移动会以鼠标为中心吸附的特效*/
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
收起
  1. 1 404 not found REOL
404 not found - REOL
00:00 / 00:00
An audio error has occurred.

作曲 : Reol

作词 : Reol

fade away...do over again...

fade away...do over again...

歌い始めの一文字目 いつも迷ってる

歌い始めの一文字目 いつも迷ってる

どうせとりとめのないことだけど

伝わらなきゃもっと意味がない

どうしたってこんなに複雑なのに

どうしたってこんなに複雑なのに

噛み砕いてやらなきゃ伝わらない

ほら結局歌詞なんかどうだっていい

僕の音楽なんかこの世になくたっていいんだよ

Everybody don't know why.

Everybody don't know why.

Everybody don't know much.

僕は気にしない 君は気付かない

何処にももういないいない

Everybody don't know why.

Everybody don't know why.

Everybody don't know much.

忘れていく 忘れられていく

We don't know,We don't know.

目の前 広がる現実世界がまた歪んだ

目の前 広がる現実世界がまた歪んだ

何度リセットしても

僕は僕以外の誰かには生まれ変われない

「そんなの知ってるよ」

気になるあの子の噂話も

シニカル標的は次の速報

麻痺しちゃってるこっからエスケープ

麻痺しちゃってるこっからエスケープ

遠く遠くまで行けるよ

安定なんてない 不安定な世界

安定なんてない 不安定な世界

安定なんてない きっと明日には忘れるよ

fade away...do over again...

fade away...do over again...

そうだ世界はどこかがいつも嘘くさい

そうだ世界はどこかがいつも嘘くさい

綺麗事だけじゃ大事な人たちすら守れない

くだらない 僕らみんなどこか狂ってるみたい

本当のことなんか全部神様も知らない

Everybody don't know why.

Everybody don't know why.

Everybody don't know much.

僕は気にしない 君は気付かない

何処にももういないいない

Everybody don't know why.

Everybody don't know why.

Everybody don't know much.

忘れていく 忘れられていく

We don't know,We don't know.