摘要: 1. 数据缺失分类 行记录的缺失,又称数据记录丢失 列值的缺失,即数据记录中某些列(变量)的值空缺 2. 数据列缺失的处理思路 2.1 丢弃 缺失值所在的行或者列整体删除,减少缺失数据对总体的影响 整行删除的前提:缺失行占总体的比例非常低,一般在5%以内 整列删除(对应变量删除)的前提:缺失值占整列 阅读全文
posted @ 2020-04-21 22:00 燕麦拿铁 阅读(1275) 评论(0) 推荐(0) 编辑
摘要: 1. 数据预处理的作用 数据分析过程中的重要环节 直接决定了后期所有数据工作的质量和价值输出 对建立模型的最终结果起到决定性的作用 2. 数据预处理的主要内容 数据清洗 数据转换 数据降维 样本不均衡 数据抽样 共线性问题 相关性 标准化 离散化 非结构化数据 阅读全文
posted @ 2020-04-21 18:02 燕麦拿铁 阅读(189) 评论(0) 推荐(0) 编辑