hadoop源码eclipse环境搭建-源码获取阶段

就目前了解,结合eclipse阅读和编译hadoop源码用两种方式:svn和git。

根据官方指南http://wiki.apache.org/hadoop/EclipseEnvironment

推荐的是git和mvn一起把源码拉下来后经过编译后import到eclipse。

从另一个中文的博客http://blog.csdn.net/basicthinker/article/details/6174442,介绍了直接用svn的方式,但从编写日期看已经两年了,可能已经不是官方推荐的方式。

引起两个计划想做的事情:

一、了解git和mvn(应该是maven),究竟两者的功能分工各是什么

二、对比svn和git下载回来源码有什么差别,或者说确定svn有什么问题不是官方推荐

svn的方式需要eclipse安装subeclipse插件,只要保证有较好的网络安装过程没问题(在虚拟机的网络环境貌似设为bridge的方式比NAT要容易达到稳定高速),按照中文博客的说明不难完成。

经过一番周折才成功完成git和mvn的源码下载编译。问题主要出在

mvn install -DskipTests

报错说protocbuf(Protocol Buffers)版本不是最新,所以要去https://code.google.com/p/protobuf/下载2.5版的下来,configure-〉make-〉make check-〉make install(root权限,sudo),编译要用C++编译器,须下载安装g++。弄完这个protobuf后这步编译总算成功。

接下来就是一个需要大量下载相关jar和doc辅助编译的步骤,最好在网络能保证的条件下进行,否则浪费时间。

最后import项目到eclipse,还要补充一个class path variable,叫M2_REPO指向~/m2/repository,但目前有几个代码问题造成hadoop-common项目有个红叉,其他有几百多个warning。

后面就要花时间看看是什么原因造成这些问题,争取处理掉这些错误,或者不能解决也要知道什么导致的。

posted @ 2013-08-29 11:03  丁峰  阅读(208)  评论(0编辑  收藏  举报