面板数据变系数模型
前言
在这一篇文章中,我们将某些影响因素的作用范围扩大,这些因素不仅影响截距项的变动,而且也能影响到斜率项。因素的作用范围就可能有一下几种组合,单独影响截距,单独影响斜率,既影响截距又影响斜率,既不影响截距也不影响斜率(随机效应)。因素又区分为两类,时间因素与个体特质因素。推荐先阅读数据分析-面板数据变截距模型 再阅读本文。
为了方便理解,我们将包含个体特质与时间因素的面板回归方程拆写为:
Yit=α0+αi+λ0+λt+X′itβi+X′itβt+X′itβc+εit
β=βi+βt+βc
,i=1,2,3,...,N;t=1,2,3,...,T
当然这里的βt与βi也可以像拆分 α和λ一样,拆分出均值和差异项
项目 |
含义 |
i |
个体标志序数 |
t |
时间序数 |
Xit |
观测变量,K∗1向量,(X1it,,X2it,..,Xkit)′ |
βi |
随个体特质而变动的参数,K∗1向量, (0,0,...,βi,..0)′ |
βt |
随时间而变动的参数,K∗1向量, (0,0,...,βt,..0)′ |
βc |
不变动的参数,K∗1向量, (β1,β2,..0...,βk)′ |
β |
总参数向量,K∗1向量, (β1,β2,...,βi,...,βt,...,βk)′ |
α0 |
个体效应在个体维度上的平均值 |
αi |
个体效应在个体维度上差异 |
α0+αi |
个体效应引起的截距项 |
λ0 |
时间效应在时间维度上的平均值 |
λt |
时间效应在时间维度上差异 |
λ0+λt |
时间效应引起的截距项 |
εit |
随机扰动项 |
固定系数模型
模型
以截距项为个体固定效应,系数为个体固定效应:
Yit=α0+αi+X′itβi+X′itβc+εit
以截距项为个体固定效应,系数为时间固定效应:
Yit=α0+αi+X′itβt+X′itβc+εit
-
以截距项为个体固定效应,系数为个体固定效应,仅考虑第3个参数随个体变化,举例理解:
Yit=α0+αi+β1x1it+β2x2it+β3ix3it+εit
其中x1it表示第i个个体在t时刻的第1个变量值,β1表示第1个变量前的参数
其中x2it表示第i个个体在t时刻的第2个变量值,β2表示第2个变量前的参数
其中x3it表示第i个个体在t时刻的第3个变量值,β3i表示依赖于第i个个体特质(第i个个体特质是个体分类的类别,表示个体差异影响x3的斜率)、第3个变量前的参数
-
以截距项为个体固定效应,系数为时间固定效应,仅考虑第3个参数随时间变化,举例理解:
Yit=α0+αi+β1x1it+β2x2it+β3tx3it+εit
其中x1it表示第i个个体在t时刻的第1个变量值,β1表示第1个变量前的参数
其中x2it表示第i个个体在t时刻的第2个变量值,β2表示第2个变量前的参数
其中x3it表示第i个个体在t时刻的第3个变量值,β3t表示依赖于第t个时段特质(第t个时段是依据时间段分类的类别,表示时间段变动影响x3的斜率)、第3个变量前的参数
估计方法
- 最小二乘虚拟变量法(LSDV)
引入虚拟变量进行回归
举例,以截距项为个体固定效应,系数为个体固定效应:
考虑β2与β3受到性别的影响
Yit=α0+αi+β1x1it+β2ix2it+β3ix3it+εit
=α0+αi+β1x1it+(β2x2it+γ1x2it∗D1+γ2x2it∗D2)+(β3x3it+η1x3it∗D1+η2x3it∗D2)+εit
=α0+αi+β1x1it+(γ3x2it∗D3+γ1x2it∗D1+γ2x2it∗D2)+(η3x3it∗D3+η1x3it∗D1+η2x3it∗D2)+εit
设置虚拟变量:
D1={1if 第i个个体性别为男性0if 第i个个体性别为其他
D2={1if 第i个个体性别为女性0if 第i个个体性别为其他
D3={1if 第i个个体性别为中性0if 第i个个体性别为其他
注意:这里引入m-1个虚拟变量与m个虚拟变量的两种方式等价。
随机系数模型
这个模型是有局限性的:模型多多少少会忽略一些解释变量,因此会导致截距项与解释变量相关。所以说模型设置为个体固定效应的模型很正常。随机变系数效应模型的截距项也应该是随机的,截距项如果不是随机的最好不要用随机变系数效应模型。
模型举例:
Swamy随机模型:
Yi=Xi~βi+εi,i=1,2,...,N
~βi=β0+βi
E(βi)=0k∗1,
E(βiβ′j)={Δi i=j0 i≠j;
E(X′itβi)=0;
E(εiε′j)={σi i=j0 i≠j;
模型设定检验
由于我们不知道模型中哪些变量的系数是变动的,所以需要依据检验是否某个变量的系数是变动的
- 数据量很大,可以考虑全部变量系数变化
- 依次从全部变量系数不同,m-1个系数不同,m-2个系数不同,...,1个系数不同逐个检验(此方法用于变量个数很多或者虚拟变量个数很多的情形)
LR检验
Yit=α0+αi+β1x1it+(β2x2it+γ1x2it∗D1+γ2x2it∗D2)+(β3x3it+η1x3it∗D1+η2x3it∗D2)+εit
原假设:γ1=γ2=η1=η2=0;(变量的系数不变动)
备择假设:γ1,γ2,η1,η2不全为0;(变系数模型)
LR检验的无约束回归方程(备择假设成立):
Yit=α0+αi+β1x1it+(β2x2it+γ1x2it∗D1+γ2x2it∗D2)+(β3x3it+η1x3it∗D1+η2x3it∗D2)+εit
计算lnLu
LR检验的约束回归方程(原假设成立):
Yit=α0+αi+β1x1it+β2x2it+β3x3it+εit
计算lnLr
Swamy检验
Yi=Xi~βi+εi,i=1,2,...,N
~βi=β0+βi
E(βi)=0k∗1,
原假设:β0=β1=β2=β3=...=βN (不变系数)
备择假设:β0,β1,β2,β3,...,βN不全相等(变系数)
- 同方差var(εi)=σ2ε
服从F分布
- 异方差var(εi)=σ2i
检验统计量为 Sw=N∑i=1(^βi−^β∗0)′X′iXi(^βi−^β∗0)^σ2id→χ2((N−1)k)(给定N;T→∞时)
^β∗0=(N∑i=1^σ2iX′iXi)−1(N∑i=1^σ2iX′iYi)
模型检验步骤
固定效应
LR逐次检验:
-
原假设:混合回归模型(截距与斜率都不变)
备择假设:截距项与斜率项(k个变量)发生变化
此时:不拒绝原假设,建立混合回归模型,检验结束;拒绝原假设,截距项与斜率项之中至少有一项在变化,因此进入下一步检验。
-
引入截距项的约束函数,验证是否成立
原假设:变量的斜率变化 (约束条件成立)
备择假设:截距项、变量的斜率变化(约束条件不成立)
此时:不拒绝原假设,认为截距项不变。接下来要检验哪些变量的斜率发生变化;拒绝原假设,认为截距项变化,接下来需要检验截距项随时点变化、个体变化、个体时点变化,以及哪些变量的斜率发生变化。
-
在上一步原假设的基础上在引入任意k-1个关于变量系数的约束条件,有1个变量系数自由另外的k-1个约束条件的,认为这1个变量系数为模型唯一变动的变量系数,否则认为至少有2个变量系数变动。
原假设:个体FX变截距,考察其中一个变量变化,另外k-1个变量不发生变化。
备择假设:个体FX变截距,至少有两个变量系数变化。
此时:不拒绝原假设,我们认为个体FE变截距,且只有一个变量斜率发生变动。检验结束。
拒绝原假设,认为截距项发生变动,并且k-1个变量的斜率中至少有一个会变。继续检验。
-
减少1个约束条件个数,重复第三步检验。
随机效应原假设:混合模型
备择假设:截距项、所有变量(k个变量)的斜率都是随机效应。
此时:若不拒绝原假设,表明建立混合(pool)模型,检验到此结束。
若拒绝原假设,建立随机系数模型。
注意:随机系数模型的截距项也应该是随机效应。
建模步骤
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!