摘要: 一直想把数据预处理的逻辑给理清楚点,在这里和大家一起分享。 一:缺失值的处理 删除缺失值 这是一种很常用的策略。 缺点:如果缺失值太多,最终删除到没有什么数据了。那就不好办了。 2.2 缺失值的填补 (1)均值法 根据缺失值的属性相关系数最大的那个属性把数据分成几个组,然后分别计算每个组的均值,把这 阅读全文
posted @ 2016-12-30 18:16 刘岩-- 阅读(34199) 评论(2) 推荐(4) 编辑