Spark RDD详解
摘要:
1.RDD是什么RDD(Resilient Distributed Dataset):是Spark的核心数据结构,指的是一个只读的、可分区的分布式数据集,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。 RDD 是只读的 RDD 是分区记录的集合 RDD 是容错的 RDD 是高效的... 阅读全文
posted @ 2015-07-25 22:46 GatsbyNewton 阅读(316) 评论(0) 推荐(0) 编辑