会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
大数据流动
公众号 大数据流动。 追随大数据的流动,专注于大数据相关技术。 相关学习交流群已经成立,欢迎加入~
博客园
首页
新随笔
联系
订阅
管理
2020年5月6日
聊聊流计算系统中的核心问题:状态管理
摘要: 本文选自《实时流计算系统设计与实现》 文末有惊喜 状态管理是流计算系统的核心问题之一。在实现流数据的关联操作时,流计算系统需要先将窗口内的数据临时保存起来,然后在窗口结束时,再对窗口内的数据做关联计算。在实现时间维度聚合特征计算和关联图谱特征计算时,更是需要创建大量的寄存用于记录聚合的结果。而CEP
阅读全文
posted @ 2020-05-06 09:30 独孤风
阅读(1046)
评论(0)
推荐(0)
编辑
公告