摘要: 1.基本概念 Spark中的一些概念: RDD(resillient distributed dataset):弹性分布式数据集。 Partition:数据分区。即一个RDD的数据可以划分为多少个分区。 NarrowDependency:窄依赖,即子RDD依赖于父RDD中固定的Partition。N 阅读全文
posted @ 2018-07-09 19:52 牧梦者 阅读(2194) 评论(0) 推荐(1) 编辑