Flink GroupBy与Window的关系
不带时间窗口的的groupby 会来一条数据进行一条数据的更新操作。这个时候结果是incrment的状态,每次都是覆盖(包含)了上次的结果。
带时间窗口的groupby 会对时间窗口内的一批数据进行处理。这个结果是segment的状态,与窗口个数对应。
个人网站:shuoyizui.com
公众号:写个框架玩
近期在公众号会发布一系列文章,主要是想完成一个简化的MapReduce框架的编写。实现Mapreduce编程模型、任务远程提交、任务分配、任务执行等功能。设计到了动态代理、反射、网络通信、序列化、消息队列、netty、自定义类加载器、多线程、shell等技术点。