摘要: 需求:将rdd数据中相同班级的学生分到一个partition中,并根据分数降序排序。 此实例用到的repartitionAndSortWithinPartitions是Spark官网推荐的一个算子,官方建议,如果需要在repartition重分区之后,还要进行排序,建议直接使用repartition 阅读全文
posted @ 2016-06-17 17:45 suinlove 阅读(6681) 评论(0) 推荐(0) 编辑