摘要: 现在要对最近7天的日志进行统计,统计结果格式如下,key(date(日期),hour(时间),site(网站))value:(pv (访问次数),uv(独立访问人数,相同的访客id去重))统计结果需要存至Hbase,使用spark写出伪代码 阅读全文
posted @ 2017-09-07 12:47 牵牛花 阅读(1237) 评论(1) 推荐(0) 编辑
摘要: http://blog.csdn.net/UnionIBM/article/details/77850979 <dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-spark</artifactId> <version> 阅读全文
posted @ 2017-09-07 12:31 牵牛花 阅读(534) 评论(2) 推荐(0) 编辑