2.3 最小二乘估计的性质
2.3.1 线性
线性指估计量 ^β0,^β1 为随机变量 yi 的样本的线性函数,由式 (2.2.8) 我们可以得到等价的表达式:
^β1=∑ni=1(xi−¯¯¯x)yi∑ni=1(xi−¯¯¯x)2(2.3.1)
可以看出 ^β1 是 yi 的线性组合,由此可进一步得出 ^β0 也可表示为 yi 的线性组合。
因为 yi 是随机变量,因此 ^β0,^β1 也可视为随机变量。
2.3.2 无偏性
由于 xi 是非随机变量,E(εi)=0,我们由下式:
E(yi)=E(β0+β1xi+εi)=β0+β1xi(2.3.2)
可以得到如下定理:
定理 2.3.1
^β0 是 β0 的无偏估计;^β1 是 β1 的无偏估计。
证明:由式 (2.3.1) 可计算期望
E(^β1)=n∑i=1(xi−¯¯¯x)∑ni=1(xi−¯¯¯x)2E(yi)=n∑i=1(xi−¯¯¯x)∑ni=1(xi−¯¯¯x)2(β0+β1xi)=β1(2.3.3)
同理可证 ^β0 是 β0 的无偏估计。
进一步有:
E(^y)=E(^β0+^β1xi)=β0+β1xi=E(y)(2.3.4)
上式表明回归值 ^y 是随机变量 y 的无偏估计,表明 ^y 与随机变量 y 的期望值是相同的。
2.3.3 β0,β1的方差
我们研究估计量的方差,由于 y1、y2、⋯、yn 是相互独立的,且 var(yi)=σ2,得
var(^β1)=n∑i=1[(xi−¯¯¯x)∑nj=1(xj−¯¯¯x)2]2var(yi)=σ2∑ni=1(xi−¯¯¯x)2(2.3.5)
我们再估计 ^β0 的方差:
var(^β0)=var(¯¯¯y−^β1¯¯¯x)=var(¯¯¯y−∑ni=1(xi−¯¯¯x)yi∑ni=1(xi−¯¯¯x)2¯¯¯x)=var(n∑i=1[1n−(xi−¯¯¯x)¯¯¯x∑ni=1(xi−¯¯¯x)2]yi)=n∑i=1[1n−(xi−¯¯¯x)¯¯¯x∑ni=1(xi−¯¯¯x)2]2var(yi)=σ2n∑i=1[1n−(xi−¯¯¯x)¯¯¯x∑ni=1(xi−¯¯¯x)2]2=σ2[1n+(¯¯¯x)2∑ni=1(xi−¯¯¯x)2](2.3.6)
从结果可以得出两点
总之可以看到,要想使 β0,β1 的估计值 ^β0,^β1 更稳定,在收集数据时,应该考虑以下两点
2.3.4 正态性
由 ^β1 和 ^β0 的线性性质可以知道,^β0 和 ^β1 都是 n 个独立的正态随机变量 yi 的线性组合,因此 ^β0 和 ^β1 也服从正态分布。且由均值和方差知:
^β0∼N(β0,(1n+(¯¯¯x)2Lxx)σ2),^β1∼N(β1,σ2Lxx)(2.3.7)
可以计算 ^β0 和 ^β1 的协方差:
cov(^β0,^β1)=cov(¯¯¯y−^β1¯¯¯x,n∑i=1(xi−¯¯¯x)∑ni=1(xi−¯¯¯x)2yi)=cov(n∑i=1[1n−(xi−¯¯¯x)¯¯¯x∑ni=1(xi−¯¯¯x)2]yi,n∑i=1(xi−¯¯¯x)∑ni=1(xi−¯¯¯x)2yi)=n∑i=1{[1n−(xi−¯¯¯x)¯¯¯x∑ni=1(xi−¯¯¯x)2](xi−¯¯¯x)∑ni=1(xi−¯¯¯x)2var(yi)}=−¯¯¯xLxxσ2(2.3.8)
式 (2.3.8) 说明,在 ¯¯¯x=0 时,^β0 与 ^β1 不相关,在正态假定条件下独立;在 ¯¯¯x≠0 时,^β0 与 ^β1 相关,在正态假定条件下不独立。
在高斯—马尔可夫条件下可以证明 ^β0 和 ^β1 分别是 β0 和 β1 的最佳线性无偏估计,也称最小方差线性无偏估计。即指在所有 β0 和 β1 的线性无偏估计中,它们的方差最小。(证明见多元线性回归中的 G - M 定理)
固定 x0 有
^y0=^β0+^β1x0(2.3.9)
估计值 ^y0 的期望已经由式 (2.3.4) 表出,下面计算其方差
var(^y0)=var(^β0+^β1x0)=var(^β0)+var(^β1x0)+2cov(^β0,^β1x0)=σ2[1n+(¯¯¯x)2Lxx]+x20σ2Lxx−2x0¯¯¯xLxxσ2=σ2[1n+(¯¯¯x)2Lxx+x20Lxx−2x0¯¯¯xLxx]=(1n+(x0−¯¯¯x)2Lxx)σ2
故估计值 ^y0 也是随机变量 y1、y2、⋯、yn 的线性组合,因此
^y0∼N(β0+β1x0,(1n+(x0−¯¯¯x)2Lxx)σ2)(2.3.10)
由此可见,^y0 是随机变量 y0 的无偏估计,且 ^y0 的方差随给定的 x0 值与 ¯¯¯x 的距离 |x0−¯¯¯x| 的增大而增大。即当给定的 x0 与 x 的样本平均值 ¯¯¯x 相差较大时,^y0 的估计波动就会增大。
因此实际应用回归方程进行控制和预测时,给定的 x0 值不能偏离样本均值太多。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现