Hadoop编译方法

伪分布式：
hadoop-env.sh core-site.xml hdfs-site.xml  mapred-site.xml 

1.在hadoop官网下载hadoop的源码（同步跟踪最新源代码）
mvn checkout http://svn.apache.org/repos/asf/hadoop/common/trunk/ hadoop-trunk

hadoop-trunk目录下即就是下载的源码

源码版本和安装的版本应该会不一样，因此先使用默认的hadoop单机配置下。因此引进的是java project，不要依赖分布式。

可以用自己编译出的安装包来进行hadoop的集群安装

在eclipse下编译并调试运行hadoop2.0源码

http://www.devba.com/index.php/archives/1571.html 我爱你，这里讲的比较详细全面

编出的jar包在：

/usr/local/hadooptrunk/hadoop-common/hadoop-dist/target/hadoop-3.0.0-SNAPSHOT/share/hadoop$

SVN checkout hadoop源码及Maven进行Hadoop源代码编译步骤

http://www.it165.net/admin/html/201309/1860.html

不完整：http://www.cnblogs.com/meibenjin/p/3172889.html

这个是将hadoop-2.1.1-SNAPSHOT.tar.gz安装伪分布式的文档（正确）（我也爱你）

Hadoop单机单节点集群安装配置 http://blog.csdn.net/dingdn/article/details/13000183

当eclipse建立mapreduce project时，DFS显示版本不对。为trunk，最新版本。

对应版本：

http://svn.apache.org/repos/asf/hadoop/common/tags/release-1.2.0/

编译方法应该一样，先编译出来试一下，重点在能在线调试。

明天试一下用新的编出来的包，运行一下伪分布式。

如果能运行，就可以改源代码了

bin/hadoop jar hadoop-examples-1.2.0.jar wordcount /words/input output

结束

eclipse安装maven插件

http://dead-knight.iteye.com/blog/1910783

远程调试新版hadoop：

http://chinahadoop.net/thread-5352-1-1.html

在eclipse下远程调试hadoop2.0 http://www.cnblogs.com/meibenjin/archive/2013/07/07/3175679.html

重要发现：新版的hadoop-2.2.0 和编译的目录完全一致啊哈哈这样就可以这个版本进行集群配置，并在此基础上修改源码。只是eclipse的插件要自己编译

（参考而已新版hadoop配置和单机单节点差不多http://yangshangchuan.iteye.com/blog/1967994）

下一步：要自己编译eclipse plugin插件

网上还流行一种编译方法：ant build工具

http://www.cnblogs.com/liuxiaojun/archive/2010/09/06/hadoop-003.htmlhttp://blog.csdn.net/dingdn/article/details/13000183

posted @ 2014-07-11 16:35 晋心阅读(442) 评论(0) 收藏举报

刷新页面返回顶部

晋心

Hadoop编译方法

SVN checkout hadoop源码及Maven进行Hadoop源代码编译步骤

Hadoop单机单节点集群安装配置 http://blog.csdn.net/dingdn/article/details/13000183

公告