摘要: Spark学习笔记之SparkRDD一、 基本概念RDD(resilient distributed datasets)弹性分布式数据集。来自于两方面① 内存集合和外部存储系统② 通过转换来自于其他RDD,如map,filter等2.创建操作(creation operation):RDD的创建由S... 阅读全文
posted @ 2015-04-18 19:12 ChouYarn 阅读(1831) 评论(0) 推荐(0) 编辑