摘要:
简介 在实际应用中,一般都需要将数据按照某个key进行分区,然后再进行计算处理;所以最为常见的状态类型就是KeyedState。之前介绍到keyBy之后的聚合、窗口计算,算子所持有的状态,都是KeyedState 另外,还可以通过富函数类(RichFunction)对转换算子进行扩展、实现自定义功能 阅读全文
摘要:
简介 在流处理中,数据是连续不断到来和处理的。每个任务进行计算处理时,可以基于当前数据直接转换得到输出结果;也可以依赖一些其他数据。这些由一个任务维护,并且用来计算输出结果的所有数据,就叫作这个任务的状态。 一、有状态算子 在Flink中,算子任务可以分为==无状态==和==有状态==两种情况。 无 阅读全文