2018年5月23日

spark-红酒-白酒评估

摘要: Storm ------------------ 实时计算,延迟很低。 吞吐量小。 tuple() Spark Streaming ------------------ DStream,离散流计算。 相当于一序列RDD。 按照时间片划分RDD。 DStream分区 = RDD的分区。 动态数据。 StreamingCont... 阅读全文

posted @ 2018-05-23 14:38 飞机耳朵 阅读(1572) 评论(0) 推荐(0) 编辑

spark-Streaming窗口化和kafak-streaming 消费策略

摘要: Spark Streaming ---------------- 流计算,不间断。 Spark Streaming模块, 实现方式是批量计算,按照时间片对stream切割形成静态数据。 //创建上下文时,指定时间片。 val ssc = new StreamingContext(conf, Seconds(1)) //已经限定了时间片 ss... 阅读全文

posted @ 2018-05-23 14:36 飞机耳朵 阅读(2269) 评论(0) 推荐(0) 编辑

导航