数学 - 回归分析 - 第 6 章 多重共线性的情形及其处理 - 6.2 多重共线性对回归模型的影响

6.2 多重共线性对回归模型的影响

6.2.1 多重共线性对回归模型的影响

设下述回归模型存在完全多重共线性

y=β0+β1x1+β2x2++βpxp+ε

即对设计矩阵 X 的列向量存在不全为零的一组数 c0c1cp 使得

c0+c1xi1+c2xi2++cpxip=0,i=1,2,,n

设计矩阵的秩 rank(X)<p+1,此时 |XX|=0,正规方程组 XXβ^=Xy 的解不唯一,(XX)1 不存在,回归参数的最小二乘估计表达式 β^=(XX)1Xy 不成立。

在实际问题中,经常遇到的是近似共线性的情形,即存在不全为零的一组数 c0c1cp 使得

c0+c1xi1+c2xi2++cpxip0,i=1,2,,n

此时设计矩阵 X 的秩 rank(X)=p+1 虽然成立,但是 |XX|0(XX)1 的对角线元素很大,β^ 的方差阵 D(β^)=σ2(XX)1 的对角线元素很大,而 D(β^) 的对角线元素即 var(β^0)var(β^1)var(β^p),因而 β0β1βp 的估计精度很低。这样,虽然用普通最小二乘估计能得到 β 的无偏估计,但估计量 β^ 的方差很大,不能正确判断解释变量对被解释变量的影响程度,甚至导致估计量的实际意义无法解释。

6.2.2 二元回归的例子

以二元回归为简单例子,我们可以看到当自变量间的相关性从小到大增加时,估计量的方差增大得很快。

y 对两个自变量 x1x2 的线性回归,假定 yx1x2 都已经中心化,此时回归常数项为零,回归方程为:

y^=β^1x1+β^2x2

L11=i=1nxi12L12=i=1nxi1xi2L22=i=1nxi22,则 x1x2 之间的相关系数为:

r12=L12L11L22

由于

XX=[L11L12L12L22]

我们可以计算 β^=(β^1,β^2) 的协方差阵为:

cov(β^)=σ2(XX)1=σ21|XX|[L22L12L12L11]=σ21L11L22(1r122)[L22L12L12L11]

由此可得

(6.2.1)var(β^1)=σ2(1r122)L11,var(β^1)=σ2(1r122)L22

可知,随着自变量 x1x2 的相关性增强,β^1β^2 的方差将逐渐增大。我们可认为当 x1x2 完全相关(r=1)时,方差将变为无穷大。

posted on   Black_x  阅读(368)  评论(0编辑  收藏  举报

编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示