Hive数仓:安装部署
1进入实验启动Hadoop集群
6.1.1在master启动Hadoop集群
[zkpk@master ~]$ start-all.sh
6.1.2在master上运行jps,确认NameNode, SecondaryNameNode, ResourceManager进程启动
6.1.3在slave01上运行jps,确认DataNode, NodeManager进程启动
6.1.4在slave02上运行jps,确认DataNode, NodeManager进程启动
6.2解压并安装Hive
6.2.1从Hive的公共目录/home/zkpk/tgz/hive下拷贝apache-hive-2.1.1-bin.tar.gz文件到/home/zkpk目录下
6.2.2使用下面的命令,拷贝并解压Hive安装包
[zkpk@master ~]$ cp ~/tgz/hive/apache-hive-2.1.1-bin.tar.gz ~/
[zkpk@master ~]$ tar -zxvf /home/zkpk/apache-hive-2.1.1-bin.tar.gz
6.2.3查看解压后hive目录中包含的文件
[zkpk@master ~]$ cd /home/zkpk/apache-hive-2.1.1-bin
[zkpk@master apache-hive-2.1.1-bin]$ ll
6.3向MySQL中添加hadoop用户和创建名为(hive)的数据库
6.3.1以root用户登录MySQL(注意:这里的root是数据库的root用户,不是系统的root用户)
6.3.1.1登录mysql(密码:zkpk)
[zkpk@master apache-hive-2.1.1-bin]$ cd
[zkpk@master ~]# mysql –uroot -pzkpk
6.3.1.2创建hadoop用户(密码:hadoop)
mysql>grant all on *.* to hadoop@'%' identified by 'hadoop';
mysql>grant all on *.* to hadoop@'localhost' identified by 'hadoop';
mysql>grant all on *.* to hadoop@'master' identified by 'hadoop';
mysql>flush privileges;
6.3.1.3创建数据库(名字:hive)
mysql> create database hive;
6.3.1.4退出MySQL
mysql> exit;
6.4配置hive
6.4.1进入hive安装目录下的配置目录
[zkpk@master ~]$ cd /home/zkpk/apache-hive-2.1.1-bin/conf/
6.4.2创建hive配置文件(名称:hive-site.xml)
[zkpk@master conf]$ vim hive-site.xml
6.4.3在hive-site.xml文件中添加如下内容
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>hive.metastore.local</name>
<value>true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://master:3306/hive?characterEncoding=UTF-8</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>hadoop</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>hadoop</value>
</property>
</configuration>
6.5复制MySQL连接驱动到hive根目录下的lib目录中(MySQL驱动已存放在/home/zkpk/tgz/下)
[zkpk@master conf]$ cd
[zkpk@master ~]$ cp /home/zkpk/tgz/sqoop/mysql-connector-java-5.1.28.jar /home/zkpk/apache-hive-2.1.1-bin/lib/
[zkpk@master ~]$ cd apache-hive-2.1.1-bin/lib/
[zkpk@master lib]$ ll | grep mysql-connector-java-5.1.28.jar
6.6配置系统zkpk用户环境变量
6.6.1命令
[zkpk@master lib]$ cd
[zkpk@master ~]$ vim /home/zkpk/.bash_profile
6.6.2将下面两行配置添加到环境变量中
#HIVE
export HIVE_HOME=/home/zkpk/apache-hive-2.1.1-bin
export PATH=$PATH:$HIVE_HOME/bin
6.6.3使环境变量生效
[zkpk@master ~]$ source /home/zkpk/.bash_profile
6.7启动并验证Hive安装
6.7.1初始化hive元数据库
说明:该命令是把hive的元数据都同步到mysql 中
[zkpk@master ~]$ schematool -dbType mysql -initSchema
注意:如果不执行上面的命令会出现下图错误
6.7.2启动hive客户端
注意:如果未配置5.7步骤中的用户环境请到hive根目录下执行“/bin/hive”
[zkpk@master ~]$ hive
6.7.3退出hive客户端
hive>exit;