摘要: 背景: RDD:弹性分布式数据集,是Spark中最基本的数据抽象,用来表示分布式集合,支持分布式操作! 五大属性 分区列表: A list of partitions 计算函数: A function for computing each split 依赖关系: A list of dependen 阅读全文
posted @ 2021-03-01 16:11 ziyuliu 阅读(132) 评论(0) 推荐(0) 编辑