1. Flink状态后端的类型:
MemoryStateBackend
FsStateBackend
RocksDBStateBackend
2. 各状态后端对比:
2.1 MemoryStateBackend:
如果没有配置,默认使用MemoryStateBackend,此时Flink的状态会保存在TaskManager的内存中,而checkpoint会保存在JobManager的内存中。
MemoryStateBackend可以通过配置来使用异步快照,通过异步快照可以避免阻塞管道。默认开启异步,也可以通过MemoryStateBackend的构造函数配置进行关闭。
new MemoryStateBackend(MAX_NEW_STATE_SIZE,false);
MemoryStateBackend的限制:
每个独立的状态(state)默认限制大小为5MB,可以通过构造函数增加容量;
状态的大小能超过akka的framesize大小
聚合状态(aggregate state)必须放入JobManager的内存
MemoryStateBackend的适用场景:
本地调试
Flink任务状态数据量较小的场景
2.2 FsStateBackend
FsStateBackend通过配置文件系统路径来进行设置,例如:“hdfs://namenode:8020/flink/checkpoints”或者"file:///date/flink/checkpoints".
FsStateBackend将动态数据保存在taskmanager的内存中,通过checkpoint机制,将状态快照写入配置好的文件系统或者目录中。最小元数据保存在jobManager的内存中,另外FsStateBackend通过配置一个fileStateThreshold阈值,小于该值时state存储到metadata中而非文件中。
FsStateBackend默认通过配置来使用异步快照,避免阻塞管道,当然也可以通过