数学 - 回归分析 - 第 3 章 多元线性回归 - 3.6 多元线性回归的区间估计

3.6 多元线性回归的区间估计

3.6.1 回归系数的置信区间

当我们有了参数向量 β 的估计量 β^ 时,需构造 βj 的一个区间——以 β^j 为中心的区间,该区间以一定概率包含 βj。由式 (3.4.5)βj^ 的分布

β^jN(βj,cjjσ2),j=0,1,,p

由此构造出一个枢轴变量

(3.6.1)tj=β^jβjcjjσ^

由定理可知 tj 的分布与 t 检验统计量式 (3.4.6) 一样,因此有

tjt(np1)

给定显著性水平 α,有

P(|β^jβjcjjσ^|<tα/2(np1))=1α

得到 βj 的置信度为 1α 的置信区间为

(3.6.2)(β^jtα/2cjjσ^,β^j+tα/2cjjσ^)

3.6.2 预测值的置信区间

预测和控制是回归模型最重要的应用,控制作为预测的反问题,此处只介绍预测。

与一元线性回归场合类似,预测分为单值预测区间预测。考虑多元线性理论回归方程

(3.6.3)y=β0+β1x1++βpxp+ε

根据已知的介绍,用最小二乘估计得到回归参数估计值。考虑多元线性经验回归方程

(3.6.4)y^=β^0+β^1x1++β^pxp=xβ^

单值预测较为简单,当给定 x0 时,我们用点估计 y^0=x0β^ 作为因变量新值的预测值,显然该估计是无偏估计。

下面重点考虑区间预测。

(1) 因变量新值的区间预测

y0y^0 视为整体,容易知该随机变量是两个正态变量相减,因此整体服从正态分布。先求期望

E(y0y^0)=0

再考虑方差,预测值 y^0 是先前独立观测到的随机变量 y1y2yn 的线性组合,现在因变量新值 y0 与之前的观测值 yi 是独立的,所以 y0y^0 是独立的。此时有

D(y0y^0)=D(y0)+D(y^0)=σ2+x0σ2(XX)1x0=σ2(1+x0(XX)1x0)

由此构造出一个枢轴变量

t=y0y^0σ2(1+x0(XX)1x0)t(np1)

给定显著性水平 α,得到置信度为 1α 的置信区间为

y^0tα/2(np1)σ2(1+x0(XX)1x0)<y0<y^0+tα/2(np1)σ2(1+x0(XX)1x0)

(2) 因变量新值的平均值的区间预测

y^0=x0β^=x0(XX)1Xy

由于

yN(Xβ,σ2In)

得到

y0N(x0β,σ2)

得到

E(y^0)=x0(XX)1XE(y)=x0(XX)1XXβ=x0β

D(y^0)=x0(XX)1XD(y)(x0(XX)1X)=σ2x0(XX)1XX(XX)1x0=σ2x0(XX)1x0

y^0N(x0β,σ2x0(XX)1x0)

由此构造出一个枢轴变量

t=y^0x0βσ^2x0(XX)1x0=y^0E(y0)σ^2x0(XX)1x0t(np1)

给定显著性水平 α,得到置信度为 1α 的置信区间为

y^0tα/2(np1)σ^2x0(XX)1x0<E(y|x0)<y^0+tα/2(np1)σ^2x0(XX)1x0

posted on   Black_x  阅读(2031)  评论(0编辑  收藏  举报

编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示