上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 29 下一页
  2020年10月22日
摘要: 有的时候,我们需要创建有环执行流图,比如将一些处理过后还不满足条件的数据,返回到最开始重新处理。 之前在做的时候,会考虑将处理后还不满足的数据,写入到单独的 Topic 中重新消费处理 今天发现 Flink Iterate 算子,发现也能满足需求 官网介绍: https://ci.apache.or 阅读全文
posted @ 2020-10-22 11:05 Flink菜鸟 阅读(675) 评论(0) 推荐(0) 编辑
  2020年10月20日
摘要: 前两天试了下 Flink SQL 写 Hive,对 Sink 部分写数据到 HDFS 的部分比较疑惑,特别是基于 checkpoint 的文件提交,所以看了下 StreamingFileSink 的源码(Flink SQL 写 hive 复用了这部分代码) StreamingFileSink 是 1 阅读全文
posted @ 2020-10-20 17:41 Flink菜鸟 阅读(2787) 评论(0) 推荐(0) 编辑
  2020年9月27日
摘要: Flink 1.11 发布了支持 MySQL CDC(Changelog Data Capture) 可以直接解析 Canal / Debezium 格式的 MySQL Binlog 对于实时处理程序,MySQL 的 Binlog 是很重要的数据源(上一个项目几乎所有实时数据都是来自业务系统的数据库 阅读全文
posted @ 2020-09-27 20:03 Flink菜鸟 阅读(10422) 评论(0) 推荐(0) 编辑
  2020年9月24日
摘要: Flink 1.11 版本对SQL的优化是很多的,其中最重要的一点就是 hive 功能的完善,不再只是作为持久化的 Catalog,而是可以用原生的 Flink SQL 流式的写数据到入 hive中 本文使用官网 “Streaming Writing” 案例 (https://ci.apache.o 阅读全文
posted @ 2020-09-24 19:35 Flink菜鸟 阅读(15195) 评论(0) 推荐(0) 编辑
  2020年9月23日
摘要: 通常的认识是:Flink 流模式跑流任务,批模式跑批任务,用流模式跑离线任务也是个有意思的事情 虽然新版 Flink 已经在 sql 上实现了一定程度的流批一体,但是 DataStream 和 DataSet API 还是相差比较大的 用 Flink 跑离线任务也是机缘巧合(也是必然,毕竟我不会 S 阅读全文
posted @ 2020-09-23 20:33 Flink菜鸟 阅读(3402) 评论(0) 推荐(0) 编辑
  2020年9月14日
摘要: 前言: Flink 窗口会将当前窗口的数据存储在状态中,等待窗口结束的时候触发计算,那窗口状态什么时候清理? (前提: 窗口的主要逻辑是在 WindowOperator 中完成的) 翻一下 WindowOperator 的代码,可以看到下面这个方法,“Drops all state for the 阅读全文
posted @ 2020-09-14 15:34 Flink菜鸟 阅读(3728) 评论(0) 推荐(0) 编辑
  2020年9月9日
摘要: 之前分享了一个 Flink 的面试题,这里简单回顾下内容: 有两个输入源,一个是命令流,一个是数据流 需要将命令流进行广播,然后和数据流进行connect,根据命令流指定的命令进行统计 实现一个输出到终端的 sink,将统计结果打印出来,每一条记录包括 taskId, targetAttr, per 阅读全文
posted @ 2020-09-09 20:20 Flink菜鸟 阅读(2126) 评论(0) 推荐(0) 编辑
  2020年9月4日
摘要: 之前看 Flink Source 的 metrics 时候,看到 FlinkKafkaConsuemr 消费 Kafka 数据的代码,感觉比较有意思,就仔细看下了 大致流程如下: FlinkKafKaConsuemr 的启动流程就不细讲了,直接跳到 FlinkKafkaConsumerBase.ru 阅读全文
posted @ 2020-09-04 16:47 Flink菜鸟 阅读(4448) 评论(0) 推荐(0) 编辑
  2020年8月26日
摘要: Checkpoint 源码流程: Flink MiniCluster 启动流程 Flink CheckpointCoordinator 启动流程 Flink Checkpoint 流程 先贴段简单的代码 val kafkaSource = new FlinkKafkaConsumer[String] 阅读全文
posted @ 2020-08-26 15:34 Flink菜鸟 阅读(4202) 评论(1) 推荐(0) 编辑
  2020年8月19日
摘要: Checkpoint 源码流程: Flink MiniCluster 启动流程 Flink CheckpointCoordinator 启动流程 Flink Checkpoint 流程 开局一张图,其他全靠吹,来一张官网 Flink 集群解析图: 官网地址:https://ci.apache.org 阅读全文
posted @ 2020-08-19 16:41 Flink菜鸟 阅读(1250) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 29 下一页