摘要: 大数据预处理,指的是在进行数据分析之前,先对采集到的原始数据所进行的诸如“清洗、填补、平滑、合并、规格化、一致性检验”等一系列操作,旨在提高数据质量,为后期分析工作奠定基础。数据预处理主要包括四个部分:数据清理、数据集成、数据转换、数据规约。 数据清理:指利用ETL等清洗工具,对有遗漏数据(缺少感兴 阅读全文
posted @ 2022-01-05 22:31 软工新人 阅读(31) 评论(0) 推荐(0) 编辑