2020年7月28日
摘要: 1.数据处理时缺失指怎么处理 1)删除样本或删除字段(缺失比例超过80%以上) 2)用中位数、平均值、众数等填充(平均数:数据分布近似于正态分布,中位数:数据分布近似于偏态分布,众数:特征值为离散值) 3)插补:同类均值插补、多重插补、极大似然估计 4)用其它字段构建模型,预测该字段的值,从而填充缺 阅读全文
posted @ 2020-07-28 21:18 ucas_python 阅读(822) 评论(0) 推荐(0) 编辑