Ubuntu14.04下Ambari安装搭建部署大数据集群(图文分五大步详解)(博主强烈推荐)
不多说,直接上干货!
写在前面的话
(1) 最近一段时间,因担任我团队实验室的大数据环境集群真实物理机器工作,至此,本人秉持负责、认真和细心的态度,先分别在虚拟机上模拟搭建ambari(基于CentOS6.5版本)和cloudermanager(基于CentOS6.5或Ubuntu14.04版本)。
(2) 大数据集群范围包括3节点和4节点。本人都尝试过。
(3) 安装搭建包括离线和在线。本人都尝试过
(4) 版本包括自定义指定和官方最新版本搭建。本人都尝试过。
(5) 大数据集群节点的增加和删减。本人都尝试过。
(6) 虚拟机和真实物理机上搭建。本人都尝试过。
关于在真实物理机器上用cloudermanger或ambari搭建大数据集群注意事项总结、经验和感悟心得(图文详解)
我的机器情况是
nssa-sensor1 (192.168.30.1) (既做ambari-server,也做ambari-agent)
nssa-sensor2 (192.168.30.2) (只做ambari-agent)
nssa-sensor3 (192.168.30.3) (只做ambari-agent)
nssa-sensor4 (192.168.30.4) (只做ambari-agent)
我这里是,参考
CentOS6.5下Ambari安装搭建部署大数据集群(图文分五大步详解)(博主强烈推荐)
第一步: 关于Ubuntu14.04下安装Ambari的准备
这里,与CentOS6.5下相同,我这里不多说
Ambari安装之Ambari安装前准备(CentOS6.5)(一)
大家,自行去安装,凡是能来看我这篇博客的朋友,想必肯定是有一定的基础了。
第二步:关于ubuntu14.04下部署本地库,镜像服务器
这里,大家可以参考如下。
Ambari安装之部署本地库(镜像服务器)(二)
进行,下载好
得到
参考官网
https://docs.hortonworks.com/HDPDocuments/Ambari-2.2.1.0/bk_Installing_HDP_AMB/content/_getting_started_setting_up_a_local_repository.html
以及,这第二步里,要注意的是,
centos系统里,是
sudo yum install yum-utils createrepo
ubuntu系统里,是
sudo apt-get install yum-utils createrepo
centos系统里,是
sudo yum install httpd
ubuntu系统里,是
sudo apt-get install httpd
然后,
部署,跟上述博客一样,放在/var/www/html下。我这里不多赘述。
或者放在//usr/local/apache/htdocs下,都是可以的。
参考我下面的博客,
Ubuntu14.04下编译安装或apt-get方式安装搭建Apache或Httpd服务(图文详解)
总结:就是,这里我们自定义构建局域网源,一种是放在/var/www/html下,一种是放在/usr/local/apache/htdocs下。都是可以的
最后,我将截图如下
/usr/loca/apache/htdocs
/var/www/html
然后,大家,可以将官方的,改成自己本地局域创建的本地源。用来安装ambari。
sudo wget http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.1.0/ambari.list
这是官网的。里面的内容如下
#VERSION_NUMBER=2.2.1.0-161 deb http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.1.0 Ambari main
我们要改成自己的。
#VERSION_NUMBER=2.2.1.0-161 deb http://192.168.30.1/hdp2.4/ubuntu14
或者
#VERSION_NUMBER=2.2.1.0-161 deb http://192.168.30.1/hdp2.4/ubuntu14 Ambari main
贴图如下
即,是如下。说明自定义局域网搭建的本地源,成功!
这里是,官网
我这里,是采取离线方式的安装,即先下载好,再来安装。
若大家,想在线安装的话,自行结合官网,然后和这篇博客来吧
在ubuntu14.04上使用ambari搭建hadoop集群
第三步:Ubuntu14.04下,安装并配置Ambaro-server
这里,可以参考
Ambari安装之安装并配置Ambari-server(三)
注意这里,用到的源还是官网的
sudo vim /etc/apt/sources.list.d
#VERSION_NUMBER=2.2.1.0-161 deb http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.1.0 Ambari main
sudo apt-get install ambari-server
正在安装中....
至此,ambari-server安装完成!
接下来,就是对ambari-server进行设置
这是我的jdk安装路径
这里为什么要回车,因为提示必须安装MySQL JDBC,回车结束ambari配置。
怎么来解决呢?需要将Ambari数据库脚本导入到数据库。
用Ambari用户(上面设置的用户)登录mysql
我是这么先设置好的
mysql> create database ambari DEFAULT CHARACTER SET utf8; Ignoring query to other database mysql> grant all on ambari.* TO 'hive'@'localhost' IDENTIFIED BY 'ambari_password'; Ignoring query to other database mysql> grant all on *.* TO 'ambari'@'nssa-sensor1' IDENTIFIED BY 'ambari_password'; Ignoring query to other database mysql> grant all on ambari.* TO 'ambari'@'%' IDENTIFIED BY 'ambari_password'; Ignoring query to other database
mysql> flush privileges;
mysql> exit;
或者
mysql> create database ambari DEFAULT CHARACTER SET utf8; Ignoring query to other database Ignoring query to other database mysql> grant all on *.* TO 'ambari'@'nssa-sensor1' IDENTIFIED BY 'ambari_password'; mysql> flush privileges; mysql> exit;
然后,将Ambari数据库脚本导入到数据库
mysql -uambari -pambari_password -hnssa-sensor1 use ambari source /var/lib/ambari-server/resources/Ambari-DDL-MySQL-CREATE.sql
注意:这里密码和主机名,要根据你自己的机器去做。
至此,ambari-server的安装和设置都做完成了。
接下来,就是启动ambari-server了。
sudo service ambari-server status
sudo service ambari-server start
第四步: 搭建单节点集群
这里,可以参考
Ambari安装之部署单节点集群
这里,单节点的安装,我就不多赘述了。因为,我这里是搭建的真实物理机器,4台。
第五步: 搭建3或4节点集群
这里,可以参考
Ambari安装之部署3个节点的HA分布式集群
在这一步,安装过程中,大家也许会出现问题。
大家,可以去看我的博客
Ambari安装之部署单节点集群
里面有讲到如何去解决
同时,我这里,还遇到一个问题。在安装的过程中,没有权限去读取/var/lib/ambari-agent的data目录,这个很好解决,去放开权限,等安装完成后,改回755就是了。
我这里,是所有的组件,我都全部安装了。
这里大家,要去对hive、oozie设置下
mysql> create database hive DEFAULT CHARACTER SET utf8; mysql> grant all on *.* TO 'hive'@'nssa-sensor1' IDENTIFIED BY 'hive_password'; mysql> flush privileges; mysql> exit;
mysql> create database oozie DEFAULT CHARACTER SET utf8; mysql> grant all on *.* TO 'oozie'@'nssa-sensor1' IDENTIFIED BY 'oozie_password'; mysql> flush privileges; mysql> exit;
其实啊,这些步骤,大家完全可以去看的这篇博客
Ambari安装之部署3个节点的HA分布式集群
这些都是浏览信息,大家看看就好
在这一步分发过程中,非常重要。大家会根据自己的网速和安装,会出现一些问题。
大家,可以去看这篇博客
安装ambari的时候遇到的ambari和hadoop问题集
ambari-server启动出现Caused by: java.lang.RuntimeException:java.lang.ClassNotFoundEception:com.mysql.jdbc.Driver问题解决办法(图文详解)
ambari-server启动出现ERROR main] DBAccessorImpl:106 - Error while creating database accessor java.lang.ClassNotFoundException:com.mysql.jdbc.Driver问题解决办法(图文详解)
当然,我这里作为补充
其实,这样的,如oozie client insatll 或者 hadoop client install 或者 zookeeper client install安装失败的原因。
归结为就是第一次安装时,网速不稳定,导致,大家在反复安装,造成了软连接死锁的问题。
这个问题的解决,其实很简单。
第一:大家可以去看这篇博客
安装ambari的时候遇到的ambari和hadoop问题集
这是一种解决方案的思路。
第二:也是我自己摸索出来的
我这里,是nssa-sensor2这台机器,已经安装好了,而其他的nssa-sensor1、nssa-sensor3和nssa-sensor4机器出现了上述问题。
这样,大家,就把这台已经正常安装好了的机器的对应目录(哪个组件出错了),拷贝过去就行了。
具体见我下面的贴图。
这是/etc/zookeeper/2.4.0.0-169/0目录结构
这是/usr/hdp/2.4.0.0-169/zookeeper目录结构
这是/usr/hdp/2.4.0.0-169/zookeeper目录结构
这是/usr/hdp/current/oozie-client目录结构
这是/usr/hdp/current/oozie-server的目录结构
至此,上述问题得以解决。
然后,大家还会出现,这个在oozie安装的过程中,会出现mysql-connect-java的jar包放置问题。
这里,大家,可以去看我下面写的博客
Oozie安装时放置Mysql驱动包的总结(网上最全)
同时,要注意,/usr/share/java目录结构,是如下(大家也可以使用我刚说的技巧,就是已经成功了的机器,将其ooize的目录结构和这个/usr/share/java拷贝过来就可以了)(别说自己没U盘,我这里是在真实物理机器上搭建的,我都可以拷贝做到,或者你也可以使用scp -r命令)
关于更多详情和疑问,见我写的博客
http://www.cnblogs.com/zlslch/category/916378.html
参考
在ubuntu14.04上使用ambari搭建hadoop集群
同时,大家可以关注我的个人博客:
http://www.cnblogs.com/zlslch/ 和 http://www.cnblogs.com/lchzls/ http://www.cnblogs.com/sunnyDream/
详情请见:http://www.cnblogs.com/zlslch/p/7473861.html
人生苦短,我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神,汇聚于互联网和个人学习工作的精华干货知识,一切来于互联网,反馈回互联网。
目前研究领域:大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。 语言涉及:Java、Scala、Python、Shell、Linux等 。同时还涉及平常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。 只要你一直关注和呆在群里,每天必须有收获
对应本平台的讨论和答疑QQ群:大数据和人工智能躺过的坑(总群)(161156071)
作者:大数据和人工智能躺过的坑
出处:http://www.cnblogs.com/zlslch/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接,否则保留追究法律责任的权利。
如果您认为这篇文章还不错或者有所收获,您可以通过右边的“打赏”功能 打赏我一杯咖啡【物质支持】,也可以点击右下角的【好文要顶】按钮【精神支持】,因为这两种支持都是我继续写作,分享的最大动力!