摘要: 1.数据清理 缺失值的处理 删除变量:若变量的缺失率较高(大于80%),覆盖率较低,且重要性较低,可以直接将变量删除。 定值填充:工程中常见用-9999进行替代 统计量填充:若缺失率较低(小于95%)且重要性较低,则根据数据分布的情况进行填充。对于数据符合均匀分布,用该变量的均值填补缺失,对于数据存 阅读全文
posted @ 2020-05-25 00:46 白云君 阅读(3215) 评论(0) 推荐(0) 编辑