摘要: 我的代码实践:https://github.com/wwcom614/Spark 1、RDD是Spark提供的核心抽象,全称为Resillient Distributed Dataset,即弹性分布式数据集。 2、RDD在抽象上来说是一种元素集合,包含了数据。它是被分区的,分为多个分区,每个分区分布 阅读全文
posted @ 2019-02-20 23:12 wwcom123 阅读(293) 评论(0) 推荐(0) 编辑