hive的安装配置(详细教程)
1.什么是hive
Hive是基于Hadoop的数据仓库解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的数据仓库也秉承了这些特性。
Hive就是在Hadoop上架了一层SQL接口,可以将SQL翻译成MapReduce去Hadoop上执行,这样就使得数据开发和分析人员很方便的使用SQL来完成海量数据的统计和分析,而不必使用编程语言开发MapReduce那么麻烦。
2. Hive安装与配置
2.1. 下载hive安装文件
可以从Apache官网下载安装文件: http://mirror.bit.edu.cn/apache/hive/
2.2.上传文件
解压文件(tar -zxvf apache-hive-1.2.2-bin.tar.gz)
重命名(mv apache-hive-1.2.2-bin hive)
2.3.配置环境变量
vim /etc/profile(路径按照自己的实际情况配置)
执行source /etc/profile让配置生效
2.4.执行hive --version,验证是否安装成功
有hive的版本显现,安装成功!
2.5.配置hive
1.修改hive-site.xml(默认是没有这个文件的,复制一个)
复制文件: cp hive-default.xml.template hive-site.xml
编辑文件: vim hive-site.xml
插入代码,具体内容根据自己的情况修改
<property> <name>javax.jdo.option.ConnectionUserName</name> <value>root</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>123456</value> </property> <property> <name>javax.jdo.option.ConnectionURL</name>mysql <value>jdbc:mysql://192.168.213.11:3306/hive</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> </property>
<property>
<name>hive.cli.print.header</name>
<value>
true
</value>
<description>Whether to print the names of the columns
in
query output.</description>
</property>
<property>
<name>hive.cli.print.current.db</name>
<value>
true
</value>
<description>Whether to include the current database
in
the Hive prompt.</description>
</property>
2.复制mysql的驱动程序到hive/lib下面,找不到的可以在我网盘下载:
链接:https://pan.baidu.com/s/10V4rDwNGlYpzhvrh3TgXrw 提取码:dg8x
3.创建hive数据库
4.初始化元数据库,命令:schematool -dbType mysql -initSchema(我已经初始化过了,图片是截取别人的,侵删)
注意:当使用的 hive 是 2.x 之前的版本,不做初始化也是 OK 的,当 hive 第一次启动的 时候会自动进行初始化,只不过会不会生成足够多的元数据库中的表。在使用过程中会 慢慢生成。但最后 进行初始化。如果使用的 2.x 版本的 Hive,那么就必须手动初始化元 数据库。
5.执行hive命令
[root@localhost hive]# hive
成功进入hive界面,hive配置完成