摘要: 一、数据预处理1、数据如果能够满足其应用的要求,那么他是高质量的。 数据质量涉及许多因素:准确性、完整性、一致性、时效性、可信性、可解释性。2、数据预处理的主要任务:数据清洗、数据集成、数据规约、数据变换。二、数据清理:试图填充缺失值,光滑噪声、识别利群点、纠正数据中的不一致。1、缺失值的处理:1)忽略元组:缺少类标号时通常这么做。但是忽略的元组其他属性也不能用,即便是有用的。2)人工填写:... 阅读全文
posted @ 2014-10-25 22:15 欢_全力以赴 阅读(2933) 评论(0) 推荐(0) 编辑