spark总结4 算子问题总结

官网上最清晰

 sc 启动spark时候就已经初始化好了

sc.textFile后 会产生一个rdd

 

spark 的算子分为两类

  一类 Transformation  转换

  一类 Action  动作

Transformation  延迟执行 记录元数据信息     当计算任务触发Action时候才会真正的开始计算

 

posted @ 2017-09-16 11:31  toov5  阅读(192)  评论(0编辑  收藏  举报