stata 学习
异方差、自相关,使用HAC标准误
异方差检验:
qui reg c y estat imtest, white
若p值<0.05,说明存在异方差
自相关检验BG检验
tsset year estat bgodfrey p<0.05,拒绝不存在自相关的假设,即存在自相关 使用HAC计算标准误 dis 36^(1/4) # 36是样本容量 newey c y d yd, lag(3) #3是上述计算值 test d yd #测试联合显著性
多重共线性表现及VIF
当二次项显著、而一次项不显著,说明存在多重共线性
estat ovtest, rhs 检测是否存在遗漏高阶非线性项
多重共线性说明数据矩阵X不满列秩,(X'X)^-1不存在,因此无法定义ols估计\beta
主要表现是,将第k个解释变量对其余解释变量回归,决定系数特别高。
多重共线性的通常症状是,虽然整个回归方程的R2较大、F检验也很显著,但单个系数的r检验却不显著。另一症状是,增减解释变量使得系数估计值发生较大变化(比如,加入的解释变量与已有解释变量构成多重共线性)。
方差膨胀因子
VIF越大,说明x的多重共线性问题越严重,Var(\beta | X)越大
因此判断多重共线性的方式:计算{VIF1, VIF2 ... VIFk}的最大值不超过10
. twoway function VIF=1/(1-X), xtitle(R2) xline (0.9, lp(dash)) yline(10, lp(dash)) xlabel(0.1(0.1)1) ylabel(10 100 200 300)
如果发现了多重共线性:
不关心,只关心方程整体的预测能力
若多重共线性不影响变量的显著性,可不必理会。因为在方差膨胀时显著,没有多重共线性只会更显著
当多重共线性影响到变量显著性,想办法处理,例如增大样本容量、剔除导致共线性的变量等。例如,对于二次项多重共线时,将变量标准化后再加入一次、二次项试试
use grilic.dta, clear
qui reg lnw s expr tenure iq smsa rns
estat vif
将变量中心化、标准化可以获得每变化1-sd后的结果
极端值
查看是否存在极端值
画图scatter 做完回归以后,predict lev, leverage use nerlove.dta,clear qui reg lntc lnq lnpl lnpk lnpf predict lev,leverage sum lev dis r(max)/r(mean) gsort -lev *降序排列
工具变量
工具变量(Instrumental Variables,简称IV)是统计学中用于解决内生性问题的一种方法。在经济学、流行病学、社会科学等领域的回归分析中,如果解释变量与误差项相关,即存在内生性问题,那么使用普通最小二乘法(OLS)估计的参数将是有偏误的。
工具变量方法的核心思想是找到一个或多个变量,这些变量与内生解释变量相关,但与误差项不相关。这样,工具变量可以用来预测内生解释变量,而不会引入误差项的偏差。
具体来说,工具变量需要满足以下两个条件:
相关性(Relevance):工具变量必须与内生解释变量有显著的相关性,即工具变量能够解释内生变量的变化。
外生性(Exogeneity):工具变量与回归方程的误差项不相关,即工具变量不受模型中其他变量的影响。
在实际操作中,找到合适的工具变量并不总是容易的。一旦找到合适的工具变量,可以通过两阶段最小二乘法(Two-Stage Least Squares,简称2SLS)来估计模型参数:
第一阶段:使用工具变量对内生解释变量进行回归,得到预测值。
第二阶段:使用第一阶段得到的预测值替换内生解释变量,对原始模型进行回归。
通过这种方法,可以得到一致的参数估计量,即使模型存在内生性问题。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!