Flink菜鸟 - 博客园

2022年2月16日

Flink SQL 同时 Join 多个 Mysql 表

摘要： flink sql lookup 多个 mysql 表阅读全文

posted @ 2022-02-16 15:03 Flink菜鸟阅读(3837) 评论(0) 推荐(1)

2022年2月15日

Flink 实时计算留存率

摘要： flink 实时计算留存率，flink stream api，窗口，水印阅读全文

posted @ 2022-02-15 15:57 Flink菜鸟阅读(1891) 评论(2) 推荐(1)

2022年1月8日

Flink sql kafka source 自定义并行度

摘要：本文参考康琪大佬的博客：使Flink SQL Kafka Source支持独立设置并行度一直觉得 Flink Sql 需要指定算子并行度的功能，哪怕是基于 SQL 解析出来的算子不能添加并行度，source、sink、join 的算子也应该有修改并行度的功能。恰好看到大佬的博客，Kafka 是最阅读全文

posted @ 2022-01-08 15:44 Flink菜鸟阅读(6099) 评论(0) 推荐(0)

2022年1月5日

Flink 读写 iceberg

摘要： flink 读写 iceberg，upsert 阅读全文

posted @ 2022-01-05 10:31 Flink菜鸟阅读(5424) 评论(0) 推荐(0)

2021年11月16日

Flink Sql Lookup Join Hbase 表非主键

摘要： flink 关联 hbase 表非主键阅读全文

posted @ 2021-11-16 15:54 Flink菜鸟阅读(3003) 评论(2) 推荐(0)

2021年10月18日

Flink 实现 Mysql Table Lookup Source

摘要： flink 实现自定义 mysql lookup source 阅读全文

posted @ 2021-10-18 15:09 Flink菜鸟阅读(2067) 评论(0) 推荐(0)

2021年10月11日

Flink 自定义 Http Table Source

摘要：自定义Flink http table source 阅读全文

posted @ 2021-10-11 11:14 Flink菜鸟阅读(2883) 评论(2) 推荐(1)

2021年9月23日

Flink 关联 Hbase 非主键

摘要： Hbase 作为 Hadoop 全家桶中，非常重要的存储组件，适用于海量数据的随机查询，使用是非常广泛的。实时数仓项目使用 Kafka 作为数仓的基础表，我们也会把 Kafka 的数据往 Hbase 写一份，方便其他场景使用，比如：做维表 Flink Hbase 表默认使用 TableScan 一阅读全文

posted @ 2021-09-23 14:10 Flink菜鸟阅读(1322) 评论(0) 推荐(0)

2021年9月9日

Flink Cumulate Window

摘要： flink CUMULATE 窗口阅读全文

posted @ 2021-09-09 09:31 Flink菜鸟阅读(4163) 评论(0) 推荐(0)

2021年9月7日

Flink sql 写 Hbase 忽略空列

摘要：数仓场景下，经常有两个表 Join 后往一个宽表写数据。比如：埋点数据中只包含 user_id，但是下游计算的需要使用用户的其他属性，就需要将埋点数据和用户数据做关联。实时场景，需要做流表 Join，用埋点数据的 user_id 去全量用户表中取用户属性。如果两部分数据产生的顺序不确定，可能先生阅读全文

posted @ 2021-09-07 17:34 Flink菜鸟阅读(1199) 评论(0) 推荐(0)