数学 - 回归分析 - 第 2 章 一元线性回归 - 2.2 回归参数的估计

2.2 回归参数 β0β1 的估计

2.2.1 普通最小二乘估计

(1) 普通最小二乘估计形式

对每一个样本观测值 (xi,yi),最小二乘法考虑观测值 yi 与其回归值 E(yi)=β0+β1xi 的离差越小越好,综合考虑 n 个离差值,定义离差平方和为:

(2.2.1)Q(β0,β1)=i=1n[yiE(yi)]2=i=1n(yiβ0β1xi)2

普通最小二乘估计,要求寻找参数 β0β1 的估计值 β^0β^1,使式 (2.2.1) 定义的离差平方和达到最小。

(2.2.2)Q(β^0,β^1)=i=1n(yiβ^0β^1xi)2=minβ0,β1i=1n(yiβ0β1xi)2

依照式 (2.2.2) 求出的 β^0β^1 就称为回归参数 β0β1 的最小二乘估计。

定义 yi回归拟合值为式 (2.2.3)

(2.2.3)y^i=β^0+β^1xi

yi残差为式 (2.2.4)

(2.2.4)ei=yiy^i

定义残差平方和

(2.2.5)i=1nei2=i=1n(yiβ^0β^1xi)2

(2.2.5) 从整体上刻画了 n 个样本观测点 (xi,yi) 到回归直线 (2.2.3) 的距离长短。

(2) 普通最小二乘估计求解

从式 (2.2.2) 中求解 β^0β^1,由于 Q 是关于 β0β1 的非负二次函数,因此最小值总是存在。由费马引理,β0β1 应满足下列方程:

(2.2.6){Qβ0|β0=β^0=2i=1n(yiβ^0β^1xi)=0Qβ1|β1=β^1=2i=1n(yiβ^0β^1xi)xi=0

正规方程组

(2.2.7){nβ^0+(i=1nxi)β^1=i=1nyi(i=1nxi)β^0+(i=1nxi2)β^1=i=1nxiyi

简单标记

x¯=1ni=1nxi,y¯=1ni=1nyi

求解正规方程组得 β0β1 的最小二乘估计:

(2.2.8){β^0=y¯β^1x¯β^1=i=1n(xix¯)(yiy¯)i=1n(xix¯)2

简单标记

(2.2.9)Lxx=i=1n(xix¯)2=i=1nxi2n(x¯)2(2.2.10)Lxy=i=1n(xix¯)(yiy¯)=i=1nxiyinx¯y¯

(2.2.8) 可简写为:

(2.2.11){β^0=y¯β^1x¯β^1=Lxy/Lxx

由式 (2.18) 可以得到残差的一个重要性质:残差平均值为 0,残差以自变量 x 加权的平均值为 0

(2.2.12){i=1nei=0i=1nxiei=0

2.2.2 最大似然估计

(1) 最大似然估计简介

给定一个总体 X,设分布密度函数为 {f(x;θ)},其中 θΘ。假设总体 X 的一个独立同分布样本为 x1x2xn,则似然函数为:

(2.2.13)L(θ;x1,x2,,xn)=i=1nf(xi;θ)

最大似然估计准则要求:在一切 θ 中选取使随机样本 (X1,X2,,Xn) 落在点 (x1,x2,,xn) 的概率最大的 θ^ 为未知参数 θ 真值的估计值,数学表示如下:

(2.2.14)L(θ^;x1,x2,,xn)=maxθL(θ;x1,x2,,xn)

似然函数的概念并不局限于独立同分布的样本,只要样本的联合密度形式已知,就可以应用最大似然估计

(2) 一元线性回归模型参数的最大似然估计

得到样本观测值 (xi,yi),其中,xi 为非随机变量,yi 为随机变量。假设 εN(0,σ2),则 yi 服从正态分布

(2.2.15)yiN(β0+β1xi,σ2)

于是 y1,y2,,yn(注意 yi 不是独立同分布的)的似然函数为:

(2.2.16)L(β0,β1,σ2;y1,y2,,yn)=i=1nfi(yi;θ)=(2πσ2)n/2exp{12σ2i=1n[yi(β0+β1xi)]2}

取对数似然函数为:

(2.2.17)ln(L)=n2ln(2πσ2)12σ2i=1n[yi(β0+β1xi)]2

为求式 (2.2.16) 的最大值,等价于对 i=1n[yi(β0+β1xi)]2 求最小值,而这又与最小二乘原理完全相同。因而 β0β1的最大似然估计就是式 (2.2.8) 的最小二乘估计。

由最大似然估计可以得到 σ2 的估计值为:

(2.2.18)σ^2=1ni=1n[yi(β^0+β^1xi)]2

上式是 σ2 的有偏估计,实际应用中,可用无偏估计量作为 σ2 的估计量

(2.2.19)σ^2=1n2i=1n[yi(β^0+β^1xi)]2

我们应该注意,最大似然估计是在 εiN(0,σ2) 的正态分布假设下求得的,而最小二乘估计对分布假设没有要求。此外,yi 虽然不是独立同分布的,但按最大似然原则仍可以求得参数的估计值(根本原因是知道样本的联合密度)。

posted on   Black_x  阅读(598)  评论(0编辑  收藏  举报

编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示