摘要: 1、 数据清洗:按照进行数据清洗,并将清洗后的数据导入hive数据库中。 两阶段数据清洗: (1)第一阶段:把需要的信息从原始日志中提取出来 ip: 199.30.25.88 time: 10/Nov/2016:00:01:03 +0800 traffic: 62 文章: article/11325 阅读全文
posted @ 2019-11-13 20:54 忒儿 阅读(282) 评论(0) 推荐(0) 编辑