摘要: Spark RDD五大特性 1、RDD由一组partition组成 2、每一个分区由一个task来处理 3、RDD之间有一些列依赖关系 4、分区类算子必须作用在kv格式得RDD上 5、spark为task执行提供了最佳计算位置,尽量将task发送到数据所在节点执行 spark 快的原因 1、spar 阅读全文
posted @ 2020-02-15 14:15 Xiaohu_BigData 阅读(903) 评论(0) 推荐(0) 编辑