Impala的特点
Impala的特点
0. 原理
基于内存的分析框架.
1.为什么会有Impala?
hive进行计算太慢了,于是就有了Impala,Impala可以理解为是hive的内存版本.
2.Impala的优点.
- hive的升级版本,完全基于内存计算
- 会hive 就会Impala
3.什么时候可以用Impala?
当要计算的数据量小于内存时,并且使用频率非常高的,经常要看的数据,而且是变化的数据.
比如说,临时性的需求,最近几天要看的数据,以后又不一定要的数据,这个时候,你不可能去写个spark程序看结果,你要是用hive的话,计算又太慢了.就可以用Impala.
4. Impala的缺点
- 完全依赖内存,就是说计算的数据量不能大于内存
5.什么时候不可以用Impala?
不是特别紧急的结果,就不要用Impala.
数据量大于内存的时候,就不要用Impala