摘要: 一.RDD是什么 RDD是Spark提供的核心抽象,全称为Resillient Distributed Dataset,即弹性分布式数据集。 在spark的源码里面我们可以看到,rdd是被abstract所修饰的,他是一个抽象类,它代表一个不可变,可分区,里面的元素可并行计算的集合。 而在spark 阅读全文
posted @ 2020-09-13 13:13 喜欢it的小聪聪 阅读(421) 评论(0) 推荐(0) 编辑