摘要: 在Hive中,ORDER BY语句是对查询结果集进行整体的排序,最终将会产生一个reducer进行全局的排序,达到的最终结果是和传统的关系型数据库是一样的。 在数据量非常大的时候,全局排序的单个reducer将会成为性能瓶颈,有可能由于数据量过大而跑不出来结果。 Hive中可以设置hive.mapr 阅读全文
posted @ 2018-08-17 00:01 空谷幽兰~泊逸 阅读(322) 评论(0) 推荐(0) 编辑