STATA fc 比较两个数据集
使用Stata 对双次录人后的数据集进行-致性检查。 对两个数据集进行-致 性检查的Stata命令为cf (compare files) ,对应的Stata菜单操作方式为Data - . Data utilities- . Compare two datasets。 Stata 是这样描述duplicates命令的: cf 命令用来比较主从数据集是否存在某 些变量上差别(只比较变量值,标签、注释及特征等不在比较之列)。 cf 的返回值若为空,说明 两个数据集是--致的; cf的返回值若为9,说明两个数据集不一致。 如果cf命令后加上all选项, 则列出全部结果(Stata 默认只列出有差异的结果) ; 如果cf命令后加上verbose选项,则列出不 一致的结果清单。 cf _all using mycf / /比较mycf与当前数据集的差别 cf - all using mycf, verbose //同上,并且列出不一致的清单 cf - all using mycf, verbose all //同上,并且列出一致的清单 cf_ all using myef, all //*同上*/ cf mpg using mycf, all /*只基于变量mpg比较,列出全部清单*/ cf mpg using mycf, verbose /*只基于变量mpg比较,列出不一致的清单*/ mpg: 2 mismatches obs 5. 59 in master; 15 in using obs 11. 55 in master; 14 in using r(9); /*ef的返回值若为9,说明两个数据集不一致*/ 根据cf命令的结果,在核对原始问卷修正数据后再进行一致性检查, 直至两个数据集完全一 致。然后,就可以开始数据清理(数据检查和数据纠正)工作了。