摘要: 我们在生产实践中经常会遇到这样的场景,需把输入源按照需要进行拆分,比如我期望把订单流按照金额大小进行拆分,或者把用户访问日志按照访问者的地理位置进行拆分等。面对这样的需求该如何操作呢? 大部分的DataStream API的算子的输出时单一输出,也就是某种数据类型的流。除了split算子(使用spl 阅读全文
posted @ 2020-05-24 20:42 Xiaohu_BigData 阅读(790) 评论(0) 推荐(0) 编辑
摘要: 我们之前学习的转换算子是无法访问时间的时间戳信息和水位线信息的。而这些在一些应用场景下,极为重要,例如MapFunction这样的map转换算子就无法访问时间戳或者当前事件的事件时间。 基于此,DataStreamAPI提供了一系列的Low-Level的转换算子,可以访问时间戳、watermark以 阅读全文
posted @ 2020-05-24 20:15 Xiaohu_BigData 阅读(575) 评论(0) 推荐(0) 编辑