摘要: 一、什么是RDD 1、RDD(Resilient Distributed DataSet)弹性分布式数据集 2、是Spark中最基本的数据抽象 3、在代码中是一个抽象类,它代表一个弹性的、不可变的、可分区,里面的元素可并行计算的集合 二、RDD的5个主要属性(property) 1、A list o 阅读全文
posted @ 2019-12-10 21:13 hyunbar 阅读(421) 评论(0) 推荐(0) 编辑