Impala快速入门

一.简介

  Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。基于Hive使用内存计算,兼顾数据仓库,具有实时、批处理、多并发的优点。是CDH平台首选的PB级大数据实时查询分析引擎。

二.优点

  1.基于内存计算,能够对PB级别数据进行交互式实时查询、分析

  2.无需转化MR,直接读取HDFS数据

  3.C++编写,LLVM统一编译运行

  4.兼容HiveSQL

  5.具有数据仓库的特点,可直接对hive数据进行分析

  6.支持数据本地化

  7.支持列式存储

  8.支持JDBC/ODBC远程连接

二.缺点

  1.对内存需求大

  2.C++编写,不开源

  3.完全依赖hive

  4.实践表明,当分区超过1W时性能严重下降

  5.稳定性不如hive

 

posted @ 2019-08-25 16:53  云山之巅  阅读(268)  评论(0编辑  收藏  举报