查看和筛选S0703a和S0703b中只有一方含“国”字的

国泰安数据很多重复值
//1.判断标准是两种:年报,股权链计算所得
//2.一致行动人为多人时,每位行动人的名称尤其自然人的名字都会成为一条观测,所以导致stkcd year会有很多重复值。

另外,对国有或非国有的判断只依赖一个变量区分,可能出错。

  cd "E:\project\general\data\公司治理特征变量\实际控制人性质"
  use  soe_nodrop.dta,clear
  keep if S0703b!=S0703a & (regexm(S0703a,"国")|regexm(S0703b,"国"))
  drop if S0702b=="3100" |S0702b=="3000"|S0702b=="3120"|S0702b=="3200"  //去掉实际控制人性质为自然人的
  order dups stkcd year ctrlratio judgec SOE S0703a S0703b
  gsort -dups stkcd year -ctrlratio judgec SOE 
  save check.dta,replace
  
  cd "E:\project\general\data\公司治理特征变量\实际控制人性质"
  use soe_nodrop.dta,clear
  keep if (regexm(S0703a,"国")==1 &regexm(S0703b,"国")==0)| (regexm(S0703a,"国")==0 &regexm(S0703b,"国")==1) //筛选S0703a和S0703b中只有一方含“国”字的
 //要把与双方都含“国”字,或者双方都不含“国”字的区分开。
  order dups stkcd year ctrlratio judgec SOE S0703a S0703b
  gsort -dups stkcd year -ctrlratio judgec SOE 
  save check.dta,replace
posted @ 2021-10-12 11:45  将军练码  阅读(77)  评论(1)    收藏  举报