回归分析 3.X 多元线性回归

多元线性回归模型

参数估计

模型表示

我们先将模型

yi=β0+β1xi1++βpxik+ϵi,i=1,,n

表示为下列矩阵形式

y=Xβ+ε

其中

y=[y1y2yn],X=[1x11x12x1k1x21x22x2k1xn1xn2xnk]β=[β0β1βk],ε=[ε1ε2εn]

将上述表示里的 β 换成 β^ , 则就得到相应的拟合值向量和残差向量

y^=Xβ^,ε^=yy^

于是前面的残差平方和就可以表示为

S(β)=i=1nεi2=εε=(yXβ)(yXβ)=yy2βXy+βXXβ

求解

经过优化得到 β 的闭式解
XXβ^=Xyβ^=(XX)1Xy

拟合值向量

拟合值向量为
y^=Xβ^=X(XX)1Xy=Hy

H 为投影矩阵, Hy 相当于把 y 投影到平面

估计的置信区间

由于

β^jβj s.e. (β^j)tnk1

所以 βj1α 置信区间为
β^j±tnk1(1α/2) s.e. (β^j)

估计的性质

误差的期望与方差:
E(ε)=0, Cov(ε)=σ2In

无偏性

由于
β^=(XX)1Xy=(XX)1X(Xβ+ε)=β+(XX)1Xε
所以
E(β^)=β+(XX)1XE(ε)=β, 为线性估计

方差

因为
β^E(β^)=β^β=(XX)1Xε
所以
(β^E(β^))(β^E(β^))=(XX)1XεεX(XX)1
协方差为

Cov(β^)=(XX)1XE(εε)X(XX)1=(XX)1Xσ2InX(XX)1=σ2(XX)1

回归方差的估计

因为

ε^=yy^=yHy=(IH)y=(IH)(Xβ+ε)=XβX(XX)1XXβ+(IH)ε=(IH)ε

E(SSres)=ε^ε^=ε(IH)(IH)ε=ε(IH)ε

所以

E(SSres )=E(ijMijεiεj)=inMiiσ2=σ2tr(M)=σ2tr(IH)=σ2tr(I)σ2tr(H)=nσ2σ2tr(Ip)=(np)σ2=σ2(nk1)

所以

E(SSres(nk1))=σ2

所以方差的估计量为
σ^2=1nk1i=1n(yiβ^0β^1xi1β^kxik)2

估计方差性质

无偏性

证明 我们要先验证下列这些结论

  • E(εAε)=σ2tr(A)
  • tr(In)=n
  • tr(H)=tr(X(XX)1X)=k+1 (要用到性质 tr(AB)=tr(BA))
  • y^=Hy,ε^=(InH)ε
  • 帽子矩阵 HInH 都是对称幂等矩阵

于是
E(SSres)=E(ε^ε^)=E[ε(InH)ε]=σ2tr(InH)=σ2(nk1)

所以
E(σ^2)=σ2

估计的标准误差

S.E.(β^i)=Var(βi)^=σ^Cii

区间估计

响应变量条件均值的置信区间

 记 x0=(1,x01,x02,,x0k), 则 E(yx0)=x0β, 所以点估计为 y0^=x0β^

E(y^0)=x0β,Var(y^0)=x0Cov(β^)x0=σ2x0(XX)1x0

所以

y^0E(yx0)σx0(XX)1x0N(0,1)

y^0E(yx0)σ^x0(XX)1x0tnk1

所以 E(yx0) 的置信区间为

y^0±tnk1(1α/2)σ^x0(XX)1x0

未知观测值的置信区间

如果要对给定 x=x0 时的响应变量值进行预测, 则显然点预测交 y^0=x0β^ , 则预测误差为 e0=y0y^0=x0β+ϵ0x0β^ 满足

E(e0)=0,Var(e0)=σ2[1+x0(XX)1x0]

于是

y0y^0σ1+x0(XX)1x0N(0,1)

y0y^0σ^1+x0(XX)1x0tnk1

从而 y0 的预测区间为

y^0±tnk1(1α/2)σ^1+x0(XX)1x0

标准化回归系数

意义

避免只根据回归系数的大小误判解释变量在模型中的重要性

做法

假设标准化之前的回归结果是 yi=β^0+β^1xi1+β^2xi2+u^i

由于 (x¯1,x¯2,y¯) 在样本回归线上, 因此

y¯=β^0+β^1x¯1+β^2x¯2

两式相减并除以被解释变量的样本标准差得到

yiy¯σ^y=σ^x1σ^yβ^1xi1x¯1σ^x1+σ^x2σ^yβ^1xi2x¯2σ^x2+u^iσ^y

得到标准化前后估计之间的关系

b^j=σ^xjσ^yβ^j

多重共线性

解释变量之间的近似线性相关关系

影响

当存在完全共线性时,矩阵 XX 是奇异的;当存在严重的近似 共线性时,XX 就会接近奇异

此时 Var(β^) 作为 σ2(XX)1 的对角元, 就会比较大。

事实上, 可以证明

Var(β^j)=σ2Sxjxj11Rj2

其中 Rj2 为回归 xjx1++xj1+xj+1++xk 的决定系数 R2 , 度量了 xj 和其它解释变量之间的共线性程度。

在建模事件中, 把 1/(1Rj2) 定义为方差膨胀因子,

VIFj=11Rj2

通常, 如果 VIF 大于 10 , 可以认为存在较严重的多重共线性。

假设检验

回归显著性检验

所有变量显著性检验

原假设与备择假设

H0:β1=β2==βk=0H1:1jk,βj0

需要构造检验统计量
因为我们假设模型有 εNn(0,σ2In)
因此有

SSresσ2=ε(InH)εσ2=εQΣQεσ2=(Qε)σΣQεσ=yΣy=i=1npyi2χ2(np)

因此构造F0=MSregMSres=SSreg/kSSres/(nk1)H0Fk,nk1

当原假设成立时, F0 会小, 所以当 F0>Fk,nk1(1α), 拒绝原假设

单个变量显著性检验

原假设与备择假设

H0:βj=0H1:βj0

检验统计量

t0=β^j s.e. (β^j)=β^jσCjjσσ^=β^j/σCjj1nk1SSresσ2H0tnk1

t0>tnk1(1α/2), 拒绝原假设

子集显著性检验 (检验解释变量的某个子集是联合不显著的)

原假设与备择假设

H0:β3=0,β4=0,β5=0

检验原理:
无约束的模型相对于约束模型添加了三个变量,这将导致模型拟 合优度的增加,即残差平方和的减小和回归平方和的增大,我们可以通过比较这两个模型残差平方和的差值是否足够大来检验原假设是否可以被拒绝,如果足够大,就意味着新加入模型的三个变量(对模型拟合的影响)是显著的.

检验统计量

F0=(SSresH0SSres)/rSSres/(nk1)

F0 大于 Fr,nk1 分布的 (1α) 分位点时,拒绝原假设.

r=1 时,上面的 F 检验和 t 显著性检验是等价的,事实上, F1,nk1=tnk12.

拟合优度改进

R2 原本存在的问题

当添加的变量与解释变量无关或其对解释变量的影响不显著时,这种拟合优度上的增加就是没有意义的

因此我们需要对传统的 R2 进行改进

Radj

R2=SSregSST=1SSresSST,Radj2=1SSres /(nk1)SST/(n1)

通过添加自由度来调整

posted @   WilliamHuang2022  阅读(166)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 使用C#创建一个MCP客户端
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示