stata 缺失值填充
//报告输出存在数据缺失的变量及该变量缺失值的个数 cap:ssc install nmissing cap:ssc install fillmissing cap:tssc install nmissing nmissing //with(linear)将缺失值改为相邻值的平均值 fillmissing var2 var3 var4 var5, with(linear) // fillmissing 命令语法 // [bysort varlist]: fillmissing varname [if] [in], [with(with_options)] // with(any):最好用来填充常量变量 (constant variable),因为会任意从非缺失值中填充缺失值。如果未指定 with_options,则作为默认值; // with(previous):使用前面的值填充当前的缺失值。如果前面的值也缺失,则当前值保持缺失状态。另外,该选项并不对数据进行排序操作,因此无论当前数据的排序如何,填充都将使用当前的排序状态来标识当前缺失值和前面的观测值; // with(next):与 with(previous) 类似,使用后面的值填充当前的缺失值。如果后面的值也缺失,则当前值保持缺失状态。另外,该选项并不对数据进行排序操作,因此无论当前数据的排序如何,填充都将使用当前的排序状态来标识当前缺失值和后面的观测值; // with(first):使用当前排序状态下的第一个值替换所有的缺失值。或者搭配 bysort,将使用每个组的第一个值; // with(last):使用当前排序状态下的最后一个值替换所有的缺失值。或者搭配 bysort,将使用每个组的最后一个值; // with(mean):使用非缺失值的平均值替换缺失值。变量类型只能为数值型 (numeric variable); // with(median):使用非缺失值的中位数替换缺失值。变量类型只能为数值型 (numeric variable); // with(min):使用非缺失值的最小值替换缺失值。变量类型只能为数值型 (numeric variable); // with(max):使用非缺失值的最大值替换缺失值。变量类型只能为数值型 (numeric variable)。