2021年1月23日
摘要: 一、概念 RDD是Resilient Distributed Dataset。RDD是Spark的基础数据结构。表现形式为不可变的分区元素的集合,并且可以在集群中并行操作。 同时, RDD 还提供了一组丰富的操作来操作这些数据. 在这些操作中, 诸如 map, flatMap, filter 等转换 阅读全文
posted @ 2021-01-23 21:39 阡陌祁画 阅读(70) 评论(0) 推荐(0) 编辑