数学 - 回归分析 - 第 7 章 岭回归 - 7.1 岭回归估计的定义
7.1 岭回归估计的定义
当设计矩阵 呈病态时, 的列向量之间有较强的线性相关性,即解释变量间存在严重的多重共线性。在这种情况下,用普通最小二乘法估计模型参数,往往参数估计方差太大,使普通最小二乘法的效果变得很不理想。为解决这个问题,统计学家从模型和数据的角度考虑,采用回归诊断和自变量选择来克服多重共线性的影响。此外,人们还对普通最小二乘估计提出了种种改进方法。
7.1.1 普通最小二乘估计带来的问题
多元线性回归模型的矩阵形式为 ,参数 的普通最小二乘估计为 。在第 章多重共线性部分有提到,当自变量 与其余变量间存在多重共线性时, 很大, 就很不稳定。
7.1.2 岭回归的定义
针对出现多重共线性时,普通最小二乘估计效果明显变差的问题,提出了一种改进最小二乘估计的方法,叫岭回归。
岭回归的想法很自然。当自变量间存在多重共线性时,,我们设想给 加上一个正常数矩阵 ,那么 接近奇异的程度就会比 接近奇异的程度小得多。考虑到量纲问题,先将数据标准化,为了计算方便,标准化后的设计矩阵仍然用 表示,定义为:
我们称式 为 的岭回归估计,其中, 称为岭参数。由于假设 已经标准化,所以 就是自变量样本相关阵。式 中 可以标准化,也可以不标准化。如果 也经过标准化,那么式 计算的实际是标准化岭回归估计。 作为 的估计应比最小二乘估计 稳定,当 时的岭回归估计 就是普通最小二乘估计。
因为岭参数 不是唯一确定的,所以得到的岭回归估计 实际是回归参数 的一个估计族。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现