摘要: 排序在很多业务场景都要用到,今天本文介绍如何借助于自定义Partition类实现hadoop部分排序。本文还是使用java和python实现排序代码。 1、部分排序。 部分排序就是在每个文件中都是有序的,和其他文件没有关系,其实很多业务场景就需要到部分排序,而不需要全局排序。例如,有个水果电商网站, 阅读全文
posted @ 2018-09-02 16:49 alunbar 阅读(1285) 评论(0) 推荐(0) 编辑