会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
一直很低调....
博客园
首页
新随笔
联系
管理
订阅
2017年11月8日
hadoop二次排序
摘要: 二次排序就是首先按照第一字段排序,然后再对第一字段相同的行按照第二字段排序,注意不能破坏第一次排序的结果。 这里主要讲如何使用一个Mapreduce就可以实现二次排序。Hadoop有自带的SecondarySort程序,但这个程序只能对整数进行排序,所以我们需要对其进行改进,使其可以对任意字符串进行
阅读全文
posted @ 2017-11-08 16:56 一直很低调....
阅读(4319)
评论(0)
推荐(1)
编辑
公告