会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
alunbar
博客园
首页
新随笔
联系
订阅
管理
2018年9月2日
一起学Hadoop——使用自定义Partition实现hadoop部分排序
摘要: 排序在很多业务场景都要用到,今天本文介绍如何借助于自定义Partition类实现hadoop部分排序。本文还是使用java和python实现排序代码。 1、部分排序。 部分排序就是在每个文件中都是有序的,和其他文件没有关系,其实很多业务场景就需要到部分排序,而不需要全局排序。例如,有个水果电商网站,
阅读全文
posted @ 2018-09-02 16:49 alunbar
阅读(1285)
评论(0)
推荐(0)
编辑
公告