摘要: 一、RDD是什么 RDD,全称为 Resilient Distributed Datasets,是一个容错的、并行的数据结构,可以让用户显式地将数据存储到磁盘和内存中,并能控制数据的分区。 RDD是只读的、分区记录的集合。RDD只能基于在稳定物理存储中的数据集和其他已有的RDD上执行确定性操作来创建 阅读全文
posted @ 2019-07-11 16:51 console.log('宇航') 阅读(340) 评论(1) 推荐(0) 编辑