impala 中SQL的优化方法

1.底层是testfile格式,上层为parquet存储,相比parquet查询性能较好。


2.对于脚本中使用的临时表,如果存在以下情况需要进行统计表信息
    1)本身数据量较大
    2)需要和大量数据表进行关联
    3)本身被较多次使用


3.对于重复使用计算的SQL,需要事前计算好数据,放到临时表中使用,节省计算资源消耗。


4.一段SQL尽量用最少left join等关联,可以多些SQL块来执行。

posted @ 2019-11-18 18:04  醉城、  阅读(2020)  评论(0编辑  收藏  举报