摘要:
总共有440633个特征缺失,数据为109525×72, 暴力删除一些列效果不好,因为有些特征可能有区分性,暴力删除会去掉有区分性的特征,这时候应尽量考虑补全,应该选择有区分性的特征。 去除特定缺失值再补0。 前7列数据缺失值过万了。 缺失值小于10的列共33列距离2.9欧式角37 缺失值小于260 阅读全文
摘要:
只把缺失值。1.删除缺失值的列。2.利用平均值、众数、中数补充缺失值。3.用数据预测缺失值。 阅读全文
摘要:
用find函数发现的 阅读全文