摘要: 通常网站日志采集的数据是不规则的,同时也包含了许多无用的日志。当需要分析一些核心指标来满足系统业务决策的时候,对日志的数据清洗在所难免,楼主本篇将介绍如何使用mapreduce程序对日志数据进行清洗,将清洗后的结构化数据存储到hive,并进行相关指标的提取。 阅读全文
posted @ 2017-05-21 12:22 有BUG 阅读(2173) 评论(4) 推荐(0) 编辑