2.1 一元线性回归模型
一元线性回归是描述两个变量之间统计关系的最简单的回归模型,通过该回归模型的建立过程,我们可以了解到回归分析方法的基本统计思想和在实际问题中的应用原理。
2.1.1 一元线性回归模型的数学形式
(1) 一元线性理论回归模型
描述 x 与 y 之间线性关系的数学结构式可用下式:
y=β0+β1x+ε(2.1.1)
变量 y 与变量 x 的关系可以用两部分来描述:一部分是由于 x 的变化引起 y 的线性变化,即 β0+β1x;另一部分是由其他一切随机因素引起的,记为 ε。
式 (2.1) 称为变量 y 对 x 的一元线性理论回归模型。一般我们称 y 为被解释变量(因变量),x 为解释变量(自变量)。式中,β0 和 β1 是未知参数,称 β0 为回归常数,β1 为回归系数;ε 表示其他随机因素的影响,通常假定 ε 满足
{E(ε)=0var(ε)=σ2(2.1.2)
对式 (2.1.1) 两端求条件期望,得
E(y|x)=β0+β1x(2.1.3)
称 (2.1.3) 为回归方程。
(2) 一元线性样本回归模型
对研究的某个实际问题,如果获得的 n 组样本观测值 (x1,y1)、(x2,y2)、⋯、(xn,yn) 符合模型式 (2.1.1),则
yi=β0+β1xi+εi,i=1,2,⋯,n(2.1.4)
由式 (2.1.2),有
{E(εi)=0var(εi)=σ2,i=1,2,⋯,n(2.1.5)
通常假定 n 组数据是独立观测的,因而 ε1、ε2、⋯、εn 是相互独立的随机变量。xi (i=1,2,⋯,n) 是确定性变量,其值可以精确测量和控制。我们称式 (2.1.4) 为一元线性样本回归模型。
式 (2.1.1) 的理论回归模型与式 (2.1.4) 的样本回归模型是等价的,因而可将两者统称为一元线性回归模型。(理论回归模型描述的是总体,样本回归模型描述的是样本)
对式 (2.1.4) 两边求数学期望和方差,得
{E(yi)=β0+β1xivar(yi)=σ2,i=1,2,⋯,n(2.1.6)
式 (2.1.6) 表明随机变量 y1、y2、⋯、yn 数学期望不等,方差相等,因此变量 y1 、y2、⋯、yn 是独立的随机变量,但并不是同分布的。而 ε1、ε2、⋯、εn 是独立同分布的随机变量。式 (2.1.6) 从平均意义上表达了变量 y 与变量 x 的统计规律性。
(3) 一元线性经验回归方程
回归分析主要任务是通过 n 组样本观测值 (xi,yi)(i=1,2,⋯,n) 对 β0,β1 进行估计。一般用 ^β0,^β1 分别表示 β0,β1 的估计值。
^y=^β0+^β1x(2.1.7)
为 y 关于 x 的一元线性经验回归方程。
(4) 一元线性回归模型的进一步假设
实际问题研究中,为方便对参数做区间估计和假设检验,我们假定模型式 (2.1) 中误差项 ε 服从正态分布。
ε∼N(0,σ2)(2.1.8)
此时 ε1、ε2、⋯、εn 是 ε 的独立同分布的样本。
εi∼N(0,σ2)(2.1.9)
在 εi 服从假定式 (2.1.9) 下,进一步有随机变量 yi 服从正态分布。
yi∼N(β0+β1xi,σ2),i=1,2,⋯,n(2.1.10)
(5) 一元线性回归模型矩阵表示
将一元线性样本回归模型 (2.1.4) 用矩阵表示。
y=⎡⎢
⎢
⎢
⎢
⎢⎣y1y2⋮yn⎤⎥
⎥
⎥
⎥
⎥⎦,x=⎡⎢
⎢
⎢
⎢⎣1x11x2⋮⋮1xn⎤⎥
⎥
⎥
⎥⎦,ε=⎡⎢
⎢
⎢
⎢⎣ε1ε2⋮εn⎤⎥
⎥
⎥
⎥⎦,β=[β0β1](2.1.11)
于是模型式 (2.1.5) 表示为式 (2.1.12),In 表示 n 阶单位阵。
y=xβ+ε,{E(ε)=0var(ε)=σ2In(2.1.12)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现