打赏

4 weekend110的hive入门

 

查看企业公认的最新稳定版本:

      https://archive.apache.org/dist/ 

 

Hive和HBase都很重要,当然啦,各自也有自己的替代品。

 

 

 

 

 

在公司里,SQL有局限,大部分时候,不需写mr程序的,用hive这个工具。

 

公司里的懂java开发员工不一定每个公司都有,但懂SQL开发员工很多。

 

Hive的替代品:impala、spark shark、spark sql…

 

Hive、impala 、spark shark、spark sql l…。相比,Hive是最慢的,因为,它是依赖mapreduce框架。

Hive是把SQL语言,翻译成mapreduce程序。

Spark sql是把SQL语言,翻译成spark程序。

 

 

 

注意啊,hive只是一个工具,你给它一个SQL程序,它就翻译成mapreduce程序,提交给集群去运行。

在一个节点上,安装一个hive、两个hive、三个hive、、、

 

以上是weekend110的hive入门

posted @ 2016-09-24 11:11  大数据和AI躺过的坑  阅读(358)  评论(0编辑  收藏  举报