2019年5月7日

spark RDD

摘要: RDD RDD是 的英文缩写,是spark的基本数据抽象,代表着一个不可变的、多分区的、可并行操作的元素集合。 RDD有5个主要属性: 分区列表 (partition list) 计算某个分区函数(compute) 依赖列表 (dependency list) _kv类型RDD的分区器_(可选的) 阅读全文

posted @ 2019-05-07 19:08 andyhe 阅读(160) 评论(0) 推荐(0) 编辑

导航