摘要: Programming with RDDs 一个RDD就是一个分布式的元素集合,在Spark中,所有的工作可以表示为要么创建新的RDDs,要么转换现有的RDDs,要么在RDDs上操作计算结果。Spark会自动地分布你的数据到集群上,并行地计算。 RDD基础 每个RDD分成很多partitions,这 阅读全文
posted @ 2016-11-18 11:27 传奇魔法师 阅读(163) 评论(0) 推荐(0) 编辑