新增访客数量MR统计之Reduce和Runner相关准备

关注公众号:分享电脑学习
回复"百度云盘" 可以免费获取所有学习文档的代码(不定期更新)
云盘目录说明:
tools目录是安装包
res 目录是每一个课件对应的代码和资源等
doc 目录是一些第三方的文档工具

 

承接上一篇文档《新增访客数量MR统计之NewInstallUserMapper相关准备

创建NewInstallUserReducer

新增访客数量MR统计之Reduce和Runner相关准备

 

编写NewInstallUserReducer

新增访客数量MR统计之Reduce和Runner相关准备

 

需要创建一个MapWritableValue对象

新增访客数量MR统计之Reduce和Runner相关准备

 

编写代码

新增访客数量MR统计之Reduce和Runner相关准备

 

需要创建一个BaseStatsValueWritable对象

新增访客数量MR统计之Reduce和Runner相关准备

 

完成代码

新增访客数量MR统计之Reduce和Runner相关准备

 

继续完成MapWritableValue

添加属性

新增访客数量MR统计之Reduce和Runner相关准备

 

添加常用方法

新增访客数量MR统计之Reduce和Runner相关准备

 

实现父类方法

新增访客数量MR统计之Reduce和Runner相关准备

 

继续完成NewInstallUserReducer

添加属性和reduce方法

新增访客数量MR统计之Reduce和Runner相关准备

 

创建一个集合,用于数据的去重,并统计数量

循环变量value,将数据保存到集合中

获取去重后uuid的数量

构建输出对象

新增访客数量MR统计之Reduce和Runner相关准备

 

构建输出对象

新增访客数量MR统计之Reduce和Runner相关准备

 

创建NewInstallUsersRunner类

新增访客数量MR统计之Reduce和Runner相关准备

 

编写NewInstallUsersRunner

新增访客数量MR统计之Reduce和Runner相关准备

 

RunMethod方法

新增访客数量MR统计之Reduce和Runner相关准备

 

设置配置文件(附在文档后)

新增访客数量MR统计之Reduce和Runner相关准备

 

处理参数,一般处理时间参数

新增访客数量MR统计之Reduce和Runner相关准备

 

设置从hbase读取数据的相关代码

新增访客数量MR统计之Reduce和Runner相关准备

 

获取job的上下文

获取给定的参数,是执行那天的数据

构建scan应用的filter

构建只获取需要字段的filter

新增访客数量MR统计之Reduce和Runner相关准备

 

需要完成getColumnFilter方法

新增访客数量MR统计之Reduce和Runner相关准备

 

继续编写setHBaseInputConfig

构建filter过滤,非launch事件的数据

应用过根据column对应的value值进行过滤, 如果hbase对应表中没有给定的列,那么数据不过滤,全部返回

新增访客数量MR统计之Reduce和Runner相关准备

 

由于我们需要获取天、周、月的数据进行统计,所以需要获取多张表的数据

新增访客数量MR统计之Reduce和Runner相关准备

 

创建HBaseAdmin进行表是否存在进行判断(注意高低版本)

新增访客数量MR统计之Reduce和Runner相关准备

 

构建scan的集合

新增访客数量MR统计之Reduce和Runner相关准备

 

低版本的方式

新增访客数量MR统计之Reduce和Runner相关准备

 

高版本的话改一下

新增访客数量MR统计之Reduce和Runner相关准备

 

过滤

新增访客数量MR统计之Reduce和Runner相关准备

 

完成run方法

新增访客数量MR统计之Reduce和Runner相关准备

 

新增访客数量MR统计之Reduce和Runner相关准备

 

代码放到云盘里了下载就可以了

新增访客数量MR统计之Reduce和Runner相关准备

 

 

posted on   那山的狐狸  阅读(189)  评论(0编辑  收藏  举报

编辑推荐:
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示