通过beeline连接代理服务器hiveserver2 操作hive
上一篇文章已经写了配置hive的步骤,也已经通过启动hive cli进去。现在使用代理服务器的方式操作hive
- hadoop01修改hadoop的core-site.xml文件
cd /bigdata/install/hadoop-3.1.4/etc/hadoop
vi core-site.xml
- 在core-site.xml中添加以下配置信息
hadoop.proxyuser.{username}.hosts 和 hadoop.proxyuser.{username}.groups
其中的{username}需要修改为自己的用户名
<property>
<name>hadoop.proxyuser.hadoop.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.hadoop.groups</name>
<value>*</value>
</property>
- 将core-site.xml文件同步到hadoop02和hadoop03
xsync core-site.xml
- 在hadoop02上启动hiveserver2
cd /bigdata/install/hive-3.1.2/bin
hiveserver2 #启动hiveserver2
- 新建会话hadoop02连接, 连接hiveserver2
cd /bigdata/install/hive-3.1.2/bin
beeline --color=true
- 通过jdbc方式连接hiveserver2, 输入用户名和密码
beeline> !connect jdbc:hive2://hadoop02:10000
- 输入用户名: hadoop、密码: 123456
Enter username for jdbc:hive2://hadoop02:10000: hadoop
Enter password for jdbc:hive2://hadoop02:10000: 123456
- 测试
0: jdbc:hive2://hadoop02:10000> show databases;
注意采坑:
- 在提交任务的过程中,可能任务会运行失败,会看到由于集群节点虚拟内存不足导致的,解决办法很简单,直接关闭虚拟内存检测就可以了
- 修改
yarn-site.xml
文件
- 修改
<property>
<name>yarn.nodemanager.vmem-check-enabled</name>
<value>false</value>
</property>
- 将
yarn-site.xml
文件分发到hadoop02, hadoop03 - 重启hadoop集群, 重启hiveserver2