摘要: spark RDD [TOC] 关于sparkRDD基本概念 RDD:弹性分布式数据集,是spark对数据的核心抽象,也是spark数据处理的基本单位 spark处理数据之前会首先把数据转换成RDD然后在RDD上对数据进行操作 spark对RDD的数据操作,其本身有两种对于RDD的算子:转换(tra 阅读全文
posted @ 2019-12-29 22:19 ltl0501 阅读(1147) 评论(0) 推荐(0) 编辑