摘要: RDD的详解 RDD:弹性分布式数据集,是Spark中最基本的数据抽象,用来表示分布式集合,支持分布式操作! RDD的创建 RDD中的数据可以来源于2个地方:本地集合或外部数据源 RDD操作 分类 转换算子 Map import org.apache.spark.rdd.RDD import org 阅读全文
posted @ 2021-11-10 20:39 lmandcc 阅读(1338) 评论(0) 推荐(1) 编辑