Flink 实时统计热门商品的TopN

文章目录

    一、需求说明

        1、以案例驱动理解

    二、技术点

    三、代码实现(一)

        1、调用底层的Process(可做类似map的操作),将Json字符串解析成MyBehavior对象

        2、提取EventTime,转换成Timestamp格式,生成WaterMark

        3、按照指定事件分组

        4、把分好组的数据,划分窗口:假设窗口总长10分钟, 步长1分钟滑动一次

        5、窗口内的数据进行聚合,拿出窗口Star时间和窗口End时间

    四、定义的单独类MyBehavior 和 ItemViewCount

        1、MyBehavior

        2、ItemViewCount

    五、最终结果

    六、代码实现(二) 更高级

        1、单独类 MyWindowAggFunction

        2、单独类 MyWindowFunction

   七、对聚合好的窗口内数据排序

        1、分组

        2、排序

详情参照:https://blog.csdn.net/young_0609/article/details/106744280

posted @ 2020-09-21 19:09  大鹏o  阅读(255)  评论(0编辑  收藏  举报