hive—UNION ALL和UNION区别,以及性能最优用法

 

 

 

UNION ALL:不去重不排序直接原表合并。
UNION:先表合并、再去重、再排序。<=>作用等价于 先distinct去重、再UNION ALL表合并、再order by排序。 
但是效率,后者是前者的3倍。
所以,数据量大时,不建议直接用UNION,建议先去重再UNION ALL。


 

posted @ 2022-01-13 11:50  马踏飞燕Beautiful  阅读(2654)  评论(0编辑  收藏  举报