基尼系数全流程分析

Dagum系数分析

Dagum基尼系数是传统基尼gini系数的升级,其可分解为组内系数、组间系数和超变密度系数,即Dagum =组内Gw +组间Gb + 超变密度Gt。

组内Gw分别反映各地区内部水平的差距、组间Gb反映各地区之间水平的差距,以及超变密度Gt反映各地区交叉重叠现象,体现相对差距情况,Dagum基尼系数弥补了其他用于测度地区差距方法因无法解决考察数据存在交重叠现象的不足,能够更好地识别地区差距来源问题。


Dagum系数案例

1 背景

当前有中国2012 ~ 2021共计10年各省的GDP数据,以及人均GDP数据,现希望将省分成七大区域(分别是华北、东北、华东、华中、华南、西南、西北)进行研究,分析中国人均GDP收的差异情况,对比各大区域的具体差异情况等,部分数据如下图所示:

数据中包括2021年31省市从2012~2021共计10年GDP和人均GDP数据,并且使用单独一列‘区域’标识省所属group即区域。

2 理论

Dagum基尼系数将不均衡分解为组内Gw、组间Gb和超变密度Gt,并且可细分研究两两组间的系数值情况等。SPSSSAU分别提供Dagum基尼系数及其贡献率指标,并且提供两两组间系数的指标情况,并且使用图示化直观展示基尼系数值,便于分析使用。

3 操作

本例子中操作截图如下:

  • 计算项:即研究不均匀的指标项,此处为人均GDP;
  • 类似年份Year:该项为可选项,如果有数据有多个年份,则单独使用一列标识年份即可,如果不放入该项,则默认仅1年数据;
  • Group:该项为研究对象的上一层级聚合,比如31个省分为七大区域,也或者31省分成南方和北方两个区域等,如果不放入该项,则直接没有组间Gb值和超变密度Gt值,正常情况下需要放入Group项。

4 SPSSAU输出结果

Dagum系数模型一共输出2个表格和2个图,说明如下:

5文字分析

从上表可知:整体上看,总体基尼系数有着一定的下降趋势,但是下降趋势不明显,2012年为0.227,2021年为0.215,以及整体对比可知,收不均的主要来源为组间GB,近10年来组间贡献率值均大于60%,相对来看组内贡献率值约在12%左右。也即说明中国人均收不均的主要来源是区域与区域之间的收入不均,而区域内部的收不均匀相对贡献较小。这与实际情况相符。

上图直观展示组内Gw、组间Gb和超变密度Gt贡献率情况,整体趋势上看,10年来中国收不均匀基本上均由组间Gb主导,即区域与区域之间的收不均匀起着主导作用。

Dagum基尼系数差异分解,可具体展示七大区域各年分别的组内基尼系数Gw值,并且展示各年份时,两两区域之间的组间基尼系数值,由于数据过多仅展示部分信息。上表格可以看到,从组内基尼系数Gw来看,整体上,华东地区、华北地区和华南地区的组内基尼系数值较大,意味着华东地区、华北地区和华南这3个区域,他们内部各省份之间的收入不均匀现象较为严重。而东北、华中地区的组内基尼系数较小,意味着该两个区域各省份之间收入相对较为均匀。西北和西南这两个区域的组内基尼系数值适中,意味着该两个区域内部各省份之间收不均情况居中。

从上图可以明显地看出:整体上,华北地区组内基尼系数值最高,意味着华北地区各省份之间的收不均匀现象最为明显,其次是华东地区,接着是华南地区。相对来看,西南地区、西北地区、华中地区和东北地区这四个区域内部的收不均匀现象较轻。除此之外,从上图可以看到,西南地区的组内基尼系数值呈现出下降趋势,也即意味着近10年来西南地区各省份收不均匀现象在减小。但是华北地区的收不均匀现象有上升态势。

6 剖析

Dagum基尼系数分析涉及以下几个关键点,分别如下:

    • 如果不放入Year项,则不会输出图形对比各年份情况;
    • 如果不放入Group项,则此时组间Gb为0,更不会有两两组别之间的PK。
 
posted @ 2022-12-29 10:54  spssau  阅读(800)  评论(0编辑  收藏  举报