2024年2月17日
摘要: 二、编写MapReduce程序清洗信件内容数据 数据清洗概述 数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。 数据清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等 阅读全文
posted @ 2024-02-17 21:42 夜的第七章i 阅读(4) 评论(0) 推荐(0) 编辑