摘要: 使用自定义排序方法实现二次排序 阅读全文
posted @ 2016-09-19 16:51 Ivan.Jiang 阅读(2184) 评论(0) 推荐(0) 编辑
摘要: spark进行二次排序,这里使用一种错误的做法,导致2个问题: 1, 按照复合key的字典排序结果并非我们所期望 2, 复合key的做法,使rdd的dize增加了1倍 阅读全文
posted @ 2016-09-19 15:31 Ivan.Jiang 阅读(655) 评论(0) 推荐(0) 编辑