统计模型与推断II 课程2
1 线性代数回顾
详见A.1&A.2部分。
- 内积 。
- 欧几里得范数 或 -范数: 。
- 向量 的线性张成: 。
- 从 到子空间 的正交投影:
- 子空间 的正交补:
- 协方差算子:
- 二次型(作业):如果 的均值为 且方差为 ,则
2 广义逆
2.1 动机:最小二乘问题
假设我们给定响应向量 和设计矩阵 。设 为固定但未知的参数。在没有进一步假设的情况下,我们总是可以写成:
如果我们定义 ,那么这与一般线性模型有什么不同?
从逼近的角度来看,最小化一种“逼近误差”形式是有意义的。选择此类误差度量的一个选项是平方距离:
最小化 的解称为最小二乘解(估计量)。写作
当梯度向量 被设置为0时, 达到最小值。虽然你可以通过求解梯度微分来得到矩阵-向量微分公式,但我们将使用已知的矩阵-向量微分公式来推导梯度。
引理 2.1
对于任意 和 ,
(i)
(ii)
应用引理 2.1:
通过求解 ,我们得到常规方程:
我们将从线性方程组的角度来研究它。
2.2 广义逆
为了研究常规方程,重要的是要对求解线性方程组有一个一般的理解:
其中 ,, 。如果 是非奇异的(这也意味着 ),则其逆 存在,因此 是唯一解。在这一类中, 不总是非奇异的。为了仍然能够系统地研究常规方程,我们引入了广义逆。
定义 2.2
矩阵 的广义逆是任何满足 的矩阵 。
定理 2.3
对于任意矩阵 ,存在非奇异矩阵 和 使得
(2.1)
其中 是一个非奇异的 对角矩阵,且 。矩阵
其中 、 和 是适当维度的任意矩阵,满足 。
定理 2.3 表明,任意矩阵 都有广义逆,且除非 是非奇异的, 可能有无穷多个广义逆。如果 是非奇异的,它有唯一的广义逆,即 。此外,定理 2.3 提示了一种计算广义逆的方法,该方法给定了分解(2.1)后。一个特殊且有用的情况称为奇异值分解(SVD)。
定理 2.4 (SVD)
对于任意矩阵 ,若其秩为 ,则存在 、、 和 ,,使得
其中 ,,且 ,并且 。
注意,SVD 并不是唯一的。例如,可以将 和 分别替换为 和 。有趣的是,可以很容易地验证 满足 ,无论是直接通过定理 2.3,还是通过 SVD 来得到。
显然,如果 ,那么 。否则,,这更易于计算。
由于 SVD 在大多数线性代数包中都有实现,因此可以直接应用 SVD 来获得广义逆的版本 。例如,R 语言中的函数 ginv()
就应用了 SVD 来计算广义逆:
library(MASS)
A <- matrix(1:9, nr=3, nc=3)
Ai <- ginv(A)
A %*% Ai %*% A # 验证
res <- svd(A) # 化简形式
Ai2 <- res$u %*% diag(1/res$d) %*% t(res$v) # 计算广义逆
A %*% Ai2 %*% A # 验证
2.3 Moore-Penrose 广义逆
定理 2.5
对于任意矩阵 ,存在唯一的矩阵 ,满足以下四个性质:
(i)
(ii)
(iii) 是对称的
(iv) 是对称的
满足上述四个性质的矩阵 称为 的 Moore-Penrose 广义逆。你可以验证我们上面对 的定义确实是 的 Moore-Penrose 广义逆。注意,证明表明 可以通过 SVD 来计算,这与我们之前讨论的广义逆相吻合。
2.4 投影矩阵
我不打算涵盖线性代数的基础知识。你可以参考Monahan(2008)的附录A.1-2进行快速复习。这里我将列出一些重要的定义和结果。你可以在Monahan(2008)中找到相关的证明。
定义 2.6
矩阵 的秩 是其独立行或列的数量。其列空间 定义为由 的列所张成的向量空间。即:
它的零空间 定义为空间 。向量空间 的维度 是 基的向量数目。
定理 2.7
(Monahan 2008年,定理A.1) 如果 ,则
定义 2.8
两个向量空间 和 被称为在 中的正交补,如果且仅如果 , ,且对于任意 有 。
定理 2.9
(Monahan 2008年,结果A.4) 如果 和 是 中的正交补,则任意向量 可以表示为:
其中 ,且该分解是唯一的。
定理 2.10
(Monahan 2008年,结果A.5)如果 ,则 和 是 的正交补。
定理 2.11
(Monahan 2008年,结果A.6)设 和 是正交补,并且 和 也是正交补。如果 ,则 。
定义 2.12
一个方阵 被称为幂等矩阵,当且仅当 。
定义 2.13
一个方阵 被称为是投影矩阵,投影到向量空间 上,当且仅当:
(i) 是幂等的。
(ii) 对于任何 , 。
(iii) 对于任何 , 。
推论 2.14
任何幂等矩阵都是投影到其列空间 上的投影矩阵。
定理 2.15
是投影到 上的投影。
显然, 并不是唯一的投影到 上的投影矩阵,因为可能存在 的不唯一性。现在,我们使用投影的概念来理解解的几何形状。回想一下,对于一致的系统 ,解的通用形式为 ,其中 为任意向量。注意到 ,因为 。也就是说, 对于任意的 。这并不巧合,下面的定理确实显示了 是投影到 上的投影。
定理 2.16
是投影到 上的投影矩阵。
示例 1
考虑矩阵 。因此, 包含了所有在直线 上的点,即通过原点的斜率为1的直线。
为了找到一个广义逆 ,我们利用以下性质:
这导致 。因此, 是矩阵 的广义逆,对于任意的 。定理 2.15 表明, 是投影到 上。举个例子,设 :
引理 2.17 (作业)
如果 对所有 都成立,则 。
引理 2.18 (作业)
对于任意矩阵 ,如果 ,则 。
定理 2.19 (作业)
一个对称且幂等的矩阵 ,如果它投影到向量空间 上,则它是唯一的。
这个唯一的投影矩阵与正交投影有密切关系。
推论 2.20
假设 是对称且幂等的矩阵,投影到 上。则 是一个投影到 的正交补的对称且幂等的投影矩阵。
显然,唯一的对称投影矩阵是非常理想的,因为它是一个正交投影。通过之前的探索,我们知道 是一个投影到 上的投影矩阵。那么,是否有办法得到唯一的对称投影矩阵到 上呢?根据定理 2.19,我们可以尝试找到一个 ,使得 是对称的。而 Moore-Penrose 广义逆可以达到这个目的。
推论 2.21
是唯一的对称投影矩阵,投影到其 上。
令 为矩阵 的 SVD,如定理 2.4 所述,,这个可以用来计算 。
示例 2(示例 1 继续)
通过计算机程序 。根据推论 2.21, 是投影到 上的唯一对称投影矩阵。
为了验证,
确实是一个对称矩阵。现在,设 ,则
这表示 投影到直线 上的正交投影。
作业
A.2, A.3, A.5, A.6, A.9
本文作者:某宇_My
本文链接:https://www.cnblogs.com/Desire-My/p/18723915
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)