4、Normal Equation 的向量投影解法与几何和直觉解释
参考:https://zhuanlan.zhihu.com/p/269232332
在线性回归的正交方程 ( Normal Equation ) 推导一文中提到使用 向量投影 的方法一步就能推导出 正交方程。从向量投影的角度,体现 线性回归 的本质。
预备知识:向量投影
平面A由基向量 所张成(Span ),换言之,平面A是
的列空间。
是平面外的一点,
是
在平面上的投影,
,求
是
和
之间的距离 :
用人话来解释下: 构建了一个平面,平面内的任何向量,它俩均可通过 线性组合 构建出来,换言之,平面外的向量它俩就搞不定了。向量
在
构建的平面外,不论
如何组合都不可能组合出
,这个问题 无解。但是,可以组合出
在平面内的投影
,这是平面内最接近
的点,
是
和
之间的偏差。于是,问题就变成了:如何找到组合
,使
。
线性代数的初心是解决: ,在明显无解的情况下(方程数 > 变量数,超定),退而求其次,解一个可以解决的近似问题:
。
垂直于
----------------------------------------------------------------------------------------------------------------------------------------------
言归正传,回到线性回归的问题:
线性回归要解决的问题是:找到合适的 ,使
实际应用中,方程的数量(样本数)经常远大于变量 / 未知数的数量(特征数),例如以下数据情况:100条数据10个字段,意味着100个方程10个未知数,显然,这样的超定方程组是无解的(over determined ),所以我们不得不改变目标,寻找一个最“接近”的近似解 ,使得
,
是
在
的列空间的投影。
将 代入
,将
代入
,将
代入
,于是就得到 Normal Equation:
翻译成线性回归的语境:由于 不在
所张成的空间内,不论
如何进行线性组合,都不可能组合出
,但是,可以组合出
在平面内的投影
,线性回归的目标就是找到参数
,使
。
在理解了线性回归的投影本质后,使用向量投影公式,只需一步就可以得到Normal Equation: 。
也可以表示为: ,其中
,被成为伪逆矩阵。
---------------------------------------------------------------------------------------------------------------------------------------------------
最后从直觉的角度再来看一下 Normal Equation 和伪逆矩阵,方便记忆:
回顾我们的出发点 ,如果
可逆,两边同时乘以
,显然
。
但在机器学习中,经常面对的是 超定( Overdetermined )方程,方程数( 数据点的数量,行,记录 )大于未知数( 即特征数,列,字段 ),非方阵, 不可逆。
是对称矩阵,也称 Gram 矩阵,它是
的方阵,大概率可逆,因此,我们很自然的希望在方程两边同时乘以
,得到:
,再两边同时乘以
就能到 Normal Equation 。这个推导并不严谨,
可能不可逆,但可作为快速记忆公式的方法。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律