2016年6月3日

摘要: 首先简单解释一下什么是state(状态)管理?我们以wordcount为例。每个batchInterval会计算当前batch的单词计数,那如果需要计算从流开始到目前为止的单词出现的次数,该如计算呢?SparkStreaming提供了两种方法:updateStateByKey和mapWithState 。mapWithState 是1.6版本新增功能,目前属于实验阶段。mapWithSta... 阅读全文
posted @ 2016-06-03 14:34 听风居士 阅读(2743) 评论(1) 推荐(0) 编辑

导航