09 2022 档案

Flink-Table API(概念、基础操作、流表转换)
摘要:在 Flink 提供的多层级 API 中,核心是 DataStream API,这是我们开发流处理应用的基本途径;底层则是所谓的处理函数(process function),可以访问事件的时间信息、注册定时器、自定义状态,进行有状态的流处理。DataStream API 和处理函数比较通用,有了这些 阅读全文

posted @ 2022-09-29 22:46 嘣嘣嚓 阅读(4153) 评论(1) 推荐(2) 编辑

Flink-状态一致性(如何保证exactly-once、flink+kafka端到端保证exactly-once)
摘要:当在分布式系统中引入状态时,自然也引入了一致性问题。一致性实际上是"正确性级别"的另一种说法,也就是说在成功处理故障并恢复之后得到的结果,与没有发生任何故障时得到的结果相比,前者到底有多正确?举例来说,假设要对最近一小时登录的用户计数。在系统经历故障之后,计数结果是多少?如果有偏差,是有漏掉的计数还 阅读全文

posted @ 2022-09-21 00:00 嘣嘣嚓 阅读(1549) 评论(0) 推荐(0) 编辑

Flink-State Backends(状态后端)
摘要:状态后端(State Backends) 每传入一条数据,有状态的算子任务都会读取和更新状态 由于有效的状态访问对于处理数据的低延迟至关重要,因此每个并行任务都会在本地维护其状态,以确保快速的状态访问 状态的存储、访问以及维护,由一个可插入的组件决定,这个组件就叫做状态后端(state backen 阅读全文

posted @ 2022-09-20 23:55 嘣嘣嚓 阅读(192) 评论(0) 推荐(0) 编辑

Flink-checkpoint配置及重启策略
摘要:Flink-checkpoint配置及重启策略 val env = StreamExecutionEnvironment.getExecutionEnvironment env.setParallelism(1) // checkpoint配置 env.enableCheckpointing(100 阅读全文

posted @ 2022-09-20 21:20 嘣嘣嚓 阅读(1174) 评论(0) 推荐(0) 编辑

Flink-容错机制-检查点原理和算法
摘要:一、一致性检查点(Checkpoints) Flink故障恢复机制的核心,就是应用状态的一致性检查点 有状态流应用的一致性检查点,其实就是所有任务的状态,在某个时间点的一份拷贝(一份快照);这个时间点,应该是所有任务都恰好处理完一个相同的输入数据的时候 二、从检查点恢复状态 在执行流应用程序期间,F 阅读全文

posted @ 2022-09-08 22:54 嘣嘣嚓 阅读(228) 评论(0) 推荐(0) 编辑

Flink-ProcessFunction
摘要:我们之前学习的转换算子是无法访问事件的时间戳信息和水位线信息的。而这在一些应用场景下,极为重要。例如 MapFunction 这样的 map 转换算子就无法访问时间戳或者当前事件的事件时间。 基于此,DataStream API 提供了一系列的 Low-Level 转换算子。可以访问时间戳、wate 阅读全文

posted @ 2022-09-06 22:56 嘣嘣嚓 阅读(115) 评论(0) 推荐(0) 编辑

Flink-状态管理
摘要:流式计算分为无状态和有状态两种情况。 无状态的计算观察每个独立事件,并根据最后一个事件输出结果。例如,流处理应用程序从传感器接收温度读数,并在温度超过 90 度时发出警告。 有状态的计算则会基于多个事件输出结果。以下是一些例子。 所有类型的窗口。例如,计算过去一小时的平均温度,就是有状态的计算。 所 阅读全文

posted @ 2022-09-05 22:02 嘣嘣嚓 阅读(93) 评论(0) 推荐(0) 编辑

导航

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8
点击右上角即可分享
微信分享提示