Flink 实时统计热门商品的TopN
文章目录
一、需求说明
1、以案例驱动理解
二、技术点
三、代码实现(一)
1、调用底层的Process(可做类似map的操作),将Json字符串解析成MyBehavior对象
2、提取EventTime,转换成Timestamp格式,生成WaterMark
3、按照指定事件分组
4、把分好组的数据,划分窗口:假设窗口总长10分钟, 步长1分钟滑动一次
5、窗口内的数据进行聚合,拿出窗口Star时间和窗口End时间
四、定义的单独类MyBehavior 和 ItemViewCount
1、MyBehavior
2、ItemViewCount
五、最终结果
六、代码实现(二) 更高级
1、单独类 MyWindowAggFunction
2、单独类 MyWindowFunction
七、对聚合好的窗口内数据排序
1、分组
2、排序
详情参照:https://blog.csdn.net/young_0609/article/details/106744280