flink双流join

一. 基本概念(https://blog.csdn.net/xianzhen376/article/details/89810958)

双流Join是Flink面试的高频问题。一般情况下说明以下几点就可以hold了:

1.join大体分类有两种:window join和interval join。window join又可以根据window的类型细分为3种,如下:

  Tumbling Window join、Sliding Window join、Session Window Join。

2. windows类型的join都是利用window的机制,先将数据缓存在window state中,当窗口触发计算时,执行join

3. interval join也是利用state存储数据再处理,区别在于state中的数据有失效机制,依靠数据触发数据清理;

4. 目前Stream join的结果是数据的笛卡尔积;

5. 日常使用中的一些问题,数据延迟、window序列化相关。

 

 

二. 双流join与传统数据库表join的区别

 

posted @ 2020-07-09 23:23  一y样  阅读(1739)  评论(0编辑  收藏  举报