会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Devil丶俊锅
博客园
首页
新随笔
联系
订阅
管理
2017年5月21日
hive网站日志数据分析
摘要: 通常网站日志采集的数据是不规则的,同时也包含了许多无用的日志。当需要分析一些核心指标来满足系统业务决策的时候,对日志的数据清洗在所难免,楼主本篇将介绍如何使用mapreduce程序对日志数据进行清洗,将清洗后的结构化数据存储到hive,并进行相关指标的提取。
阅读全文
posted @ 2017-05-21 12:22 有BUG
阅读(2173)
评论(4)
推荐(0)
编辑
公告