会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
y1126
博客园
首页
新随笔
联系
订阅
管理
2024年2月17日
二月总结
摘要: 二、编写MapReduce程序清洗信件内容数据 数据清洗概述 数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。 数据清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等
阅读全文
posted @ 2024-02-17 21:42 夜的第七章i
阅读(4)
评论(0)
推荐(0)
编辑