交互项回归与分组回归有什么差异?
我们先引入一个简单的收入回归方程:
其中Wage 是小时工资,Di 为是否接受工作培训的虚拟变量,X是控制变量。
假设我们想看一下D 对Wage 的影响是否因性别而异。我们即可以引入交互项:
观察交互项的系数 是否显著即可:
也可以使用分组回归:
然后再检验Di 的回归系数差异是否显著即可。
不难发现,上述两种方法隐含着不同的假设。交互项回归中,仅要求Di的系数存在组间差异,对控制变量不作要求 (两组共享一个回归系数);分组回归则认为每个变量都存在组间差异,各组变量都有自己的回归系数。
毫无疑问,交互项回归的假设相对严格,因为控制变量亦可能存在组间差异。但是,交互项也有好处,那就是更容易得出显著的结果,而且省了组间差异检验这一步。
备注:交互项stata中可以做一下F检验——是否存在显著差异
. testparm c.weight#c.foreign ( 1) c.weight#c.foreign = 0 F( 1, 68) = 5.92 Prob > F = 0.0176