会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
故事。已开始
博客园
首页
新随笔
联系
订阅
管理
2019年11月13日
MapReduce数据清洗及Hive数据库操作
摘要: 1、 数据清洗:按照进行数据清洗,并将清洗后的数据导入hive数据库中。 两阶段数据清洗: (1)第一阶段:把需要的信息从原始日志中提取出来 ip: 199.30.25.88 time: 10/Nov/2016:00:01:03 +0800 traffic: 62 文章: article/11325
阅读全文
posted @ 2019-11-13 22:56 故事-已开始。
阅读(222)
评论(0)
推荐(0)
编辑
公告