RICH-ATONE

2020年11月2日 #

hive实现全局排序使用sort by+order by还是直接使用order by表较好

摘要: 如果数据量较小的话,直接使用order by即可 。实际场景中一般先使用sort by再使用order by效率更高一些 。 sort by只能保证在reduce内有序 。 hive实现全排序: 1.要么用order by,但这样默认了reducer个数为1,效率低下。 2.要么用sort by+o 阅读全文

posted @ 2020-11-02 15:07 RICH-ATONE 阅读(1530) 评论(0) 推荐(0) 编辑

oozie安装配置详解

摘要: https://www.cnblogs.com/czlan91/articles/10805637.html http://shiyanjun.cn/archives/664.html (简单之美) 阅读全文

posted @ 2020-11-02 14:50 RICH-ATONE 阅读(89) 评论(0) 推荐(0) 编辑

导航