Hadoop源码编译(面试必备)
Hadoop编译源码(面试重点)
1.CentOS联网
配置CentOS能连接外网。Linux虚拟机ping www.baidu.com 是畅通的
注意:采用root角色编译,减少文件夹权限出现问题
2.jar包准备(hadoop源码、JDK8、maven、ant 、protobuf)
(1)hadoop-2.7.2-src.tar.gz
(2)jdk-8u144-linux-x64.tar.gz
(3)apache-ant-1.9.9-bin.tar.gz(build工具,打包用的)
(4)apache-maven-3.0.5-bin.tar.gz
(5)protobuf-2.5.0.tar.gz(序列化的框架)
-
首先下载Hadoop源码,下载地址
-
下载地址
https://archive.apache.org/dist/hadoop/common/hadoop-2.7.2/
#注意:
在hadoop-2.7.2-src.tar.gz的源码包根目录下有一个文档叫做BUINDING.txt,
这其中说明了编译hadoop所需要的一些编译环境相关的东西。不同的hadoop版本的要求都不一样。对应的版本参照BUINDING.txt。
所需软件包百度网盘下载地址:
链接:https://pan.baidu.com/s/1yC0urS3MkOt6cMxhLyXOyw
提取码:itxo
#创建软件包路径与软件安装路径并上传软件包
[root@hadoop105 ~]# mkdir /opt/module
[root@hadoop105 ~]# mkdir /opt/software
[root@hadoop105 ~]# cd /opt/software/
[root@hadoop105 software]# ls
apache-ant-1.9.9-bin.tar.gz hadoop-2.7.2-src.tar.gz protobuf-2.5.0.tar.gz
apache-maven-3.0.5-bin.tar.gz jdk-8u144-linux-x64.tar.gz
一、初始环境准备:
-
1.jar包安装
注意:所有操作必须在root用户下完成
- JDK解压、配置环境变量 JAVA_HOME和PATH,验证java-version(如下都需要验证是否配置成功)
[root@hadoop105 software]# tar -zxf jdk-8u144-linux-x64.tar.gz -C /opt/module/
[root@hadoop105 software]# vi /etc/profile
......
#JAVA_HOME:
export JAVA_HOME=/opt/module/jdk1.8.0_144
export PATH=$PATH:$JAVA_HOME/bin
[root@hadoop105 software]# source /etc/profile
[root@hadoop105 software]# java -version
java version "1.8.0_144"
-
2.maven配置
[root@hadoop105 software]# tar -zxvf apache-maven-3.0.5-bin.tar.gz -C /opt/module/
[root@hadoop105 software]# cd ../module/apache-maven-3.0.5/
#编辑settings.xml,增加<mirror>内容
[root@hadoop105 apache-maven-3.0.5]# vi conf/settings.xml
<mirrors>
<!-- mirror
| Specifies a repository mirror site to use instead of a given repository. The repository that
| this mirror serves has an ID that matches the mirrorOf element of this mirror. IDs are used
| for inheritance and direct lookup purposes, and must be unique across the set of mirrors.
|
<mirror>
<id>mirrorId</id>
<mirrorOf>repositoryId</mirrorOf>
<name>Human Readable Name for this Mirror.</name>
<url>http://my.repository.com/repo/path</url>
</mirror>
-->
......#以下为增加内容
<mirror>
<id>nexus-aliyun</id>
<mirrorOf>central</mirrorOf>
<name>Nexus aliyun</name>
<url>http://maven.aliyun.com/nexus/content/groups/public/</url>
</mirror>
......
</mirrors>
[root@hadoop105 apache-maven-3.0.5]# vi /etc/profile
#MAVEN_HOME
export MAVEN_HOME=/opt/module/apache-maven-3.0.5
export PATH=$PATH:$MAVEN_HOME/bin
[root@hadoop105 apache-maven-3.0.5]# source /etc/profile
[root@hadoop105 apache-maven-3.0.5]# mvn -version
Apache Maven 3.0.5
-
3.ant配置
[root@hadoop105 software]# cd /opt/software/
[root@hadoop105 software]# tar -zxvf apache-ant-1.9.9-bin.tar.gz -C /opt/module/
[root@hadoop105 software]# vi /etc/profile
#ANT_HOME
export ANT_HOME=/opt/module/apache-ant-1.9.9
export PATH=$PATH:$ANT_HOME/bin
[root@hadoop105 software]# source /etc/profile
[root@hadoop105 software]# ant -version
Apache Ant(TM) version 1.9.9 compiled on February 2 2017
-
4.安装 glibc-headers 、 g++ 、make和cmake
[root@hadoop105 apache-ant-1.9.9]# yum install glibc-headers gcc-c++ make cmake -y
-
5.配置protobuf
[root@hadoop105 apache-ant-1.9.9]# cd /opt/software
[root@hadoop105 software]# tar -zxvf protobuf-2.5.0.tar.gz -C /opt/module/
[root@hadoop105 software]# cd /opt/module/protobuf-2.5.0/
[root@hadoop105 protobuf-2.5.0]# ./configure
#编译过程中可能出现警告等,忽略即可,等待两分钟就完成了
[root@hadoop105 protobuf-2.5.0]# make
[root@hadoop105 protobuf-2.5.0]# make check
[root@hadoop105 protobuf-2.5.0]# make install
[root@hadoop105 protobuf-2.5.0]# ldconfig
[root@hadoop105 protobuf-2.5.0]# vi /etc/profile
#LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/opt/module/protobuf-2.5.0
export PATH=$PATH:$LD_LIBRARY_PATH
[root@hadoop105 protobuf-2.5.0]# source /etc/profile
[root@hadoop105 protobuf-2.5.0]# protoc --version
libprotoc 2.5.0
-
6.安装库文件openssl-devel 与ncurses-devel
[root@hadoop105 software]# yum install openssl-devel ncurses-devel -y
# 到此,编译工具安装基本完成。
二、编译源码:
1. 解压源码到/opt/目录
[root@hadoop105 software]# tar -zxvf hadoop-2.7.2-src.tar.gz -C /opt/
2. 进入到hadoop源码主目录
[root@hadoop105 software]# cd /opt/hadoop-2.7.2-src/
3. 通过maven执行编译命令
[root@hadoop105 hadoop-2.7.2-src]# mvn package -Pdist,native -DskipTests -Dtar
等待时间30分钟左右,最终成功是全部SUCCESS,如图所示。
- 编译成功如下图示
#1.成功的64位hadoop包在/opt/hadoop-2.7.2-src/hadoop-dist/target下
[root@hadoop105 target]# pwd
/opt/hadoop-2.7.2-src/hadoop-dist/target
#5. 编译源码过程中常见的问题及解决方案
(1)MAVEN install时候JVM内存溢出
处理方式:在环境配置文件和maven的执行文件均可调整MAVEN_OPT的heap大小。
(详情查阅MAVEN 编译 JVM调优问题,如:http://outofmemory.cn/code-snippet/12652/maven-outofmemoryerror-method)
(2)编译期间maven报错。可能网络阻塞问题导致依赖库下载不完整导致,多次执行命令(一次通过比较难):
[root@hadoop101 hadoop-2.7.2-src]#mvn package -Pdist,nativeN -DskipTests -Dtar
(3)报ant、protobuf等错误,插件下载未完整或者插件版本问题,最开始链接有较多特殊情况,
#同时推荐
2.7.0版本的问题汇总帖子 http://www.tuicool.com/articles/IBn63qf
技术是没有终点的,也是学不完的,最重要的是活着、不秃。 学习看书还是看视频,都不重要,重要的是学会,欢迎关注,我们的目标---不秃。
---更多运维开发交流及软件包免费获取请加V: Linuxlaowang