Cloudera HUE大数据可视化分析
1.Hue 概述及版本下载
1)概述
Hue是一个开源的Apache Hadoop UI系统,最早是由Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job等等。
2)下载
(由于之前安装Hive的版本为0.13,所以我们选择安装hue-3.7.0-cdh5.3.6版本,因为3.9.0版本的hue所需的hive最低版本要求高于0.13)
CDH版本下载
官网下载
2.编译安装
1)上传解压(拟安装在第三台主机)
2)安装依赖包
注:执行以下命令时需要连接外网,所以需要将网络配置为自动获取(DHCP)模式,下载安装完成后再将网络配置回来。
依赖包参考此连接。
3)编译
这样出现了build目录即表示make成功!
Hue的所有操作命令都在bin目录下。
3.Hue 基本配置与服务启动
1)修改配置文件
做如下配置:
2)修改desktop.db 文件权限
3)启动Hue服务
4)查看Hue web界面
账号和密码为个人kfk集群账号及密码,我的均为kfk。
4.Hue与HDFS集成
1)修改hue.ini配置文件
2)修改core-site.xml配置文件
添加如下内容
3)将core-site.xml配置文件分发到其他节点
4)重新启动hue
首先启动Hadoop集群
再启动hue
5.Hue与YARN集成
修改hue.ini配置文件
6.Hue与Hive集成
修改hue.ini配置文件
7.Hue与mysql集成
1)修改hue.ini配置文件
2)重新启动hue
在这之前需要先启动数据库服务、hive服务和hiveserver2。
8.Hue与HBase集成
1)修改hue.ini配置文件
2)HBase中启动thrift服务(节点1)
3)重新启动hue
搜索浏览量前5的新闻:
提交之后的执行过程如下所示:
9.Hue使用注意事项
1)如果hive版本不是cdh版本的时候回存在无法打印日志到hue界面的问题,解决方法:hive启动使用后台启动方式:
2)hue使用稳定版本:hue-3.7.0-cdh5.3.6
以上就是博主为大家介绍的这一板块的主要内容,这都是博主自己的学习过程,希望能给大家带来一定的指导作用,有用的还望大家点个支持,如果对你没用也望包涵,有错误烦请指出。如有期待可关注博主以第一时间获取更新哦,谢谢!同时也欢迎转载,但必须在博文明显位置标注原文地址,解释权归博主所有!
本博文由博主子墨言良原创,未经允许禁止转载,若有兴趣请关注博主以第一时间获取更新哦!