stata 学习

异方差、自相关,使用HAC标准误
异方差检验:

qui reg c y
estat imtest, white

若p值<0.05,说明存在异方差
自相关检验BG检验

tsset year
estat bgodfrey
p<0.05,拒绝不存在自相关的假设,即存在自相关
使用HAC计算标准误
dis 36^(1/4) # 36是样本容量
newey c y d yd, lag(3) #3是上述计算值
test d yd #测试联合显著性

多重共线性表现及VIF
当二次项显著、而一次项不显著,说明存在多重共线性
estat ovtest, rhs 检测是否存在遗漏高阶非线性项
多重共线性说明数据矩阵X不满列秩,(X'X)^-1不存在,因此无法定义ols估计\beta
主要表现是,将第k个解释变量对其余解释变量回归,决定系数特别高。
多重共线性的通常症状是,虽然整个回归方程的R2较大、F检验也很显著,但单个系数的r检验却不显著。另一症状是,增减解释变量使得系数估计值发生较大变化(比如,加入的解释变量与已有解释变量构成多重共线性)。
方差膨胀因子

VIF越大,说明x的多重共线性问题越严重,Var(\beta | X)越大
因此判断多重共线性的方式:计算{VIF1, VIF2 ... VIFk}的最大值不超过10

. twoway function VIF=1/(1-X),
xtitle(R2) xline (0.9, lp(dash)) yline(10, lp(dash))
xlabel(0.1(0.1)1) ylabel(10 100 200 300)

如果发现了多重共线性:
不关心,只关心方程整体的预测能力
若多重共线性不影响变量的显著性,可不必理会。因为在方差膨胀时显著,没有多重共线性只会更显著
当多重共线性影响到变量显著性,想办法处理,例如增大样本容量、剔除导致共线性的变量等。例如,对于二次项多重共线时,将变量标准化后再加入一次、二次项试试
use grilic.dta, clear
qui reg lnw s expr tenure iq smsa rns
estat vif
将变量中心化、标准化可以获得每变化1-sd后的结果

极端值
查看是否存在极端值

画图scatter
做完回归以后,predict lev, leverage
use nerlove.dta,clear
qui reg lntc lnq lnpl lnpk lnpf
predict lev,leverage
sum lev
dis r(max)/r(mean)
gsort -lev *降序排列

工具变量
工具变量(Instrumental Variables,简称IV)是统计学中用于解决内生性问题的一种方法。在经济学、流行病学、社会科学等领域的回归分析中,如果解释变量与误差项相关,即存在内生性问题,那么使用普通最小二乘法(OLS)估计的参数将是有偏误的。
工具变量方法的核心思想是找到一个或多个变量,这些变量与内生解释变量相关,但与误差项不相关。这样,工具变量可以用来预测内生解释变量,而不会引入误差项的偏差。
具体来说,工具变量需要满足以下两个条件:
相关性(Relevance):工具变量必须与内生解释变量有显著的相关性,即工具变量能够解释内生变量的变化。
外生性(Exogeneity):工具变量与回归方程的误差项不相关,即工具变量不受模型中其他变量的影响。
在实际操作中,找到合适的工具变量并不总是容易的。一旦找到合适的工具变量,可以通过两阶段最小二乘法(Two-Stage Least Squares,简称2SLS)来估计模型参数:
第一阶段:使用工具变量对内生解释变量进行回归,得到预测值。
第二阶段:使用第一阶段得到的预测值替换内生解释变量,对原始模型进行回归。
通过这种方法,可以得到一致的参数估计量,即使模型存在内生性问题。

posted @   GeoRepublic  阅读(37)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
点击右上角即可分享
微信分享提示