RDD

RDD:Resilient Distributed Dataset,弹性分布式数据集;

创建、转换、操作

转化操作和行动操作的区别在于 Spark 计算 RDD 的方式不同。它们只有第一次在一个行动操作中用到时,才会真正计算。

posted @ 2017-08-18 11:57  mzzcy  阅读(161)  评论(0编辑  收藏  举报