摘要: Spark的算子的分类 从大方向来说,Spark 算子大致可以分为以下两类: 1)Transformation 变换/转换算子:这种变换并不触发提交作业,完成作业中间过程处理。 Transformation 操作是延迟计算的,也就是说从一个RDD 转换生成另一个 RDD 的转换操作不是马上执行,需要 阅读全文
posted @ 2019-02-25 22:38 kpsmile 阅读(17450) 评论(1) 推荐(1) 编辑