摘要: 8 阅读全文
posted @ 2015-07-25 22:22 孟尧 阅读(87) 评论(0) 推荐(0) 编辑
摘要: 7 阅读全文
posted @ 2015-07-25 22:17 孟尧 阅读(95) 评论(0) 推荐(0) 编辑
摘要: 1.1、RDD的分区 Spark对RDD提供了两种分区方式,分别是基于哈希(HashPartitioner)和基于范围排序的(RangePartitioner)的分区器,实现类来自https://github.com/apache/spark/blob/v2.4.7/core/src/main/sc 阅读全文
posted @ 2015-07-25 22:16 孟尧 阅读(249) 评论(0) 推荐(0) 编辑