12 2022 档案
摘要:分流 将一条数据流拆分成完全独立的两条、甚至多条流。基于一个 DataStream,得到完全平等的多个子 DataStream。 SingleOutputStreamOperator<Event> stream = env.addSource(new ClickSource()) .assignTi
阅读全文
摘要:基本处理函数 函数功能 处理函数主要是定义数据流的转换工作。 处理函数提供了一个“定时服务”,可以通过它访问流中的事件、时间戳、水位线,甚至可以注册“定时事件”。继承了 AbstractRichFunction 抽象类, 所以拥有富函数类的所有特性,同样可以访问状态和其他运行时信息。处理函数还可以直
阅读全文
摘要:时间语义 在事件发生之后,生成的数据被收集起来,首先进入分布式消息队列,然后被 Flink 系统中的 Source 算子读取,进而向下游的转换算子(窗口算子)传递,最终由窗口算子进行计算处理。 处理时间(Processing Time):执行处理操作的机器系统时间,是最简单的时间语义。 事件时间(E
阅读全文
摘要:执行环境 获取的执行环境是 StreamExecutionEnvironment 类的对象。在代码中创建执行环境的方法,就是调用这个类的静态方法。 getExecutionEnvironment 根据上下文直接得到正确的结果: 如果程序是独立运行的,返回一个本地执行环境。 如果创建了 jar 包,从
阅读全文