STATA fc 比较两个数据集

使用Stata 对双次录人后的数据集进行-致性检查。 
对两个数据集进行-致
性检查的Stata命令为cf (compare files) ,对应的Stata菜单操作方式为Data - . Data utilities- .
Compare two datasets。
Stata 是这样描述duplicates命令的: 
cf 命令用来比较主从数据集是否存在某
些变量上差别(只比较变量值,标签、注释及特征等不在比较之列)。
cf 的返回值若为空,说明
两个数据集是--致的;
cf的返回值若为9,说明两个数据集不一致。
如果cf命令后加上all选项,
则列出全部结果(Stata 默认只列出有差异的结果) ;
如果cf命令后加上verbose选项,则列出不
一致的结果清单。

cf _all using mycf
/
/比较mycf与当前数据集的差别

cf - all using mycf, verbose

//同上,并且列出不一致的清单

cf - all using mycf, verbose all

//同上,并且列出一致的清单
cf_ all using myef, all

//*同上*/

cf mpg using mycf, all

/*只基于变量mpg比较,列出全部清单*/

cf mpg using mycf, verbose

/*只基于变量mpg比较,列出不一致的清单*/

mpg:
2 mismatches

obs 5. 59 in master; 15 in using

obs 11. 55 in master; 14 in using

r(9);

/*ef的返回值若为9,说明两个数据集不一致*/

根据cf命令的结果,在核对原始问卷修正数据后再进行一致性检查, 直至两个数据集完全一
致。然后,就可以开始数据清理(数据检查和数据纠正)工作了。

 

posted @ 2023-12-06 20:19  myrj  阅读(565)  评论(0编辑  收藏  举报