上一页 1 2 3 4 5 6 7 8 ··· 29 下一页
  2022年2月15日
摘要: flink 实时计算留存率,flink stream api,窗口,水印 阅读全文
posted @ 2022-02-15 15:57 Flink菜鸟 阅读(1709) 评论(2) 推荐(1) 编辑
  2022年1月8日
摘要: 本文参考康琪大佬的博客:使Flink SQL Kafka Source支持独立设置并行度 一直觉得 Flink Sql 需要指定算子并行度的功能,哪怕是基于 SQL 解析出来的算子不能添加并行度,source、sink、join 的算子也应该有修改并行度的功能。 恰好看到大佬的博客,Kafka 是最 阅读全文
posted @ 2022-01-08 15:44 Flink菜鸟 阅读(5319) 评论(0) 推荐(0) 编辑
  2022年1月5日
摘要: flink 读写 iceberg,upsert 阅读全文
posted @ 2022-01-05 10:31 Flink菜鸟 阅读(5153) 评论(0) 推荐(0) 编辑
  2021年11月16日
摘要: flink 关联 hbase 表非主键 阅读全文
posted @ 2021-11-16 15:54 Flink菜鸟 阅读(2678) 评论(2) 推荐(0) 编辑
  2021年10月18日
摘要: flink 实现自定义 mysql lookup source 阅读全文
posted @ 2021-10-18 15:09 Flink菜鸟 阅读(1923) 评论(0) 推荐(0) 编辑
  2021年10月11日
摘要: 自定义Flink http table source 阅读全文
posted @ 2021-10-11 11:14 Flink菜鸟 阅读(2583) 评论(2) 推荐(1) 编辑
  2021年9月23日
摘要: Hbase 作为 Hadoop 全家桶中,非常重要的存储组件,适用于海量数据的随机查询,使用是非常广泛的。 实时数仓项目使用 Kafka 作为数仓的基础表,我们也会把 Kafka 的数据往 Hbase 写一份,方便其他场景使用,比如:做维表 Flink Hbase 表默认使用 TableScan 一 阅读全文
posted @ 2021-09-23 14:10 Flink菜鸟 阅读(1201) 评论(0) 推荐(0) 编辑
  2021年9月9日
摘要: flink CUMULATE 窗口 阅读全文
posted @ 2021-09-09 09:31 Flink菜鸟 阅读(3657) 评论(0) 推荐(0) 编辑
  2021年9月7日
摘要: 数仓场景下,经常有两个表 Join 后往一个宽表写数据。比如:埋点数据中只包含 user_id,但是下游计算的需要使用用户的其他属性,就需要将埋点数据和用户数据做关联。 实时场景,需要做流表 Join,用埋点数据的 user_id 去全量用户表中取用户属性。 如果两部分数据产生的顺序不确定,可能先生 阅读全文
posted @ 2021-09-07 17:34 Flink菜鸟 阅读(1080) 评论(0) 推荐(0) 编辑
  2021年8月24日
摘要: 一个同学在群里问的这个问题,刚好好久没写过window 的sql了,玩一玩 手上没有环境,一起从简了 使用 datagen 生成数据,id 随机生成,最小值 输出直接到 console 窗口 -- flink window tvf calc pv&uv create table if not exi 阅读全文
posted @ 2021-08-24 10:52 Flink菜鸟 阅读(1521) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 29 下一页