查看和筛选S0703a和S0703b中只有一方含“国”字的
国泰安数据很多重复值
//1.判断标准是两种:年报,股权链计算所得
//2.一致行动人为多人时,每位行动人的名称尤其自然人的名字都会成为一条观测,所以导致stkcd year会有很多重复值。
另外,对国有或非国有的判断只依赖一个变量区分,可能出错。
cd "E:\project\general\data\公司治理特征变量\实际控制人性质"
use soe_nodrop.dta,clear
keep if S0703b!=S0703a & (regexm(S0703a,"国")|regexm(S0703b,"国"))
drop if S0702b=="3100" |S0702b=="3000"|S0702b=="3120"|S0702b=="3200" //去掉实际控制人性质为自然人的
order dups stkcd year ctrlratio judgec SOE S0703a S0703b
gsort -dups stkcd year -ctrlratio judgec SOE
save check.dta,replace
cd "E:\project\general\data\公司治理特征变量\实际控制人性质"
use soe_nodrop.dta,clear
keep if (regexm(S0703a,"国")==1 ®exm(S0703b,"国")==0)| (regexm(S0703a,"国")==0 ®exm(S0703b,"国")==1) //筛选S0703a和S0703b中只有一方含“国”字的
//要把与双方都含“国”字,或者双方都不含“国”字的区分开。
order dups stkcd year ctrlratio judgec SOE S0703a S0703b
gsort -dups stkcd year -ctrlratio judgec SOE
save check.dta,replace