摘要: RDD详解 原文连接 http://xiguada.org/spark_rdd/ RDD(Resilient Distributed Datasets弹性分布式数据集),是spark中最重要的概念,可以简单的把RDD理解成一个提供了许多操作接口的数据集合,和一般数据集不同的是,其实际数据分布存储于一 阅读全文
posted @ 2014-11-29 15:07 南国故人(Wall) 阅读(11133) 评论(0) 推荐(0) 编辑