xuanlin的专栏
居士人生
摘要: 本期内容 : BatchDuration与 Process Time 动态Batch Size Spark Streaming中有很多算子,是否每一个算子都是预期中的类似线性规律的时间消耗呢? 例如:join操作和普通Map操作的处理数据的时间消耗是否会呈现出一致的线性规律呢,也就是说,并非数据量规 阅读全文
posted @ 2016-06-07 12:39 xuanlin的专栏 阅读(3092) 评论(0) 推荐(0) 编辑
摘要: 本期内容 : Spark Streaming中的架构设计和运行机制 Spark Streaming深度思考 Spark Streaming的本质就是在RDD基础之上加上Time ,由Time不断的运行触发周而复始的接收数据及产生Job处理数据。 一、 ReceiverTracker : Receiv 阅读全文
posted @ 2016-06-07 05:12 xuanlin的专栏 阅读(446) 评论(0) 推荐(0) 编辑