摘要: RDD概念 定义 RDD(Resilient Distributed Datasets), 是一个容错的, 并行的数据结构, 可以让用户显式地将数据存储到磁盘和内存中, 并能控制数据的分区. 同时, RDD 还提供了一组丰富的操作来操作这些数据. 在这些操作中, 诸如 map, flatMap, f 阅读全文
posted @ 2021-01-07 23:30 MoooJL 阅读(169) 评论(0) 推荐(0) 编辑