摘要: Spark 对数据的核心抽象——弹性分布式数据集(Resilient Distributed Dataset,简称 RDD)。RDD 其实就是分布式的元素集合。在 Spark 中,对数据的所有操作不外乎创建 RDD、转化已有 RDD 以及调用 RDD 操作进行求值。而在这一切背后,Spark 会自动 阅读全文
posted @ 2019-03-30 20:18 |旧市拾荒| 阅读(2179) 评论(0) 推荐(0) 编辑