摘要: 1.序列化调优 序列化在任何分布式应用程序的性能中起着重要的作用。 缓慢的对象序列化过程或消费大量字节的格式都将会大大减慢计算速度 Spark 宗旨在于方便(允许您使用操作中的任何 Java 类型)和性能(速度与消耗更少的资源)之间.Spark 提供了 Java , Kryo 两种序列化库 1.1  阅读全文
posted @ 2018-07-15 21:26 NightPxy 阅读(304) 评论(0) 推荐(0) 编辑
摘要: 1.Persist 与RDD类似,DStream允许用户将流数据存至内存或磁盘(依据用户设置的持久化级别). 注意: 在DStream中,默认是存储到内存中.(RDD默认MEMORY_ONLY) 对于基于窗口的操作, 如 reduceByWindow 和 reduceByKeyAndWindow 以 阅读全文
posted @ 2018-07-15 01:15 NightPxy 阅读(469) 评论(0) 推荐(0) 编辑