MapReduce and MachineLearning——笔记四(配置开发环境—上)

    在windows上进行hadoop相关的开发,需要在eclipse上安装hadoop开发插件。最新释放出的hadoop包含源码的包,以hadoop-1.1.1为例,包含相关的eclipse插件的源码,因此可以针对自己的eclipse版本来编译一个hadoop的eclipse插件,我的eclipse的版本代号为indigo,以此为例,下面详细介绍插件的编译安装过程。

一. 下载hadoop-1.1.1

    我的下载地址为:(http://www.fayea.com/apache-mirror/hadoop/common/stable/hadoop-1.1.1.tar.gz )下载完成后解压到文件目录下。目录结构如下图所示。

    

二. 安装ant

    下载ant-1.8.x版本,解压到文件系统,在环境变量中配置ant的bin路径。

三. 修改编译配置文件

    在hadoop解压目录下,找到src\contrib\eclipse-plugin\build.xml,修改以下几行:

    

<path id="hadoop-core-jar">
    <fileset dir="${hadoop.root}/">
        <include name="hadoop*.jar"/>
    </fileset>
  </path>

  <!-- Override classpath to include Eclipse SDK jars -->
  <path id="classpath">
    <pathelement location="${build.classes}"/>
    <pathelement location="${hadoop.root}/build/classes"/>
    <path refid="eclipse-sdk-jars"/>
    <path refid="hadoop-core-jar"/>
  </path>
......
  <target name="jar" depends="compile" unless="skip.contrib">
    <mkdir dir="${build.dir}/lib"/>
    <copy file="${hadoop.root}/hadoop-core-${version}.jar" tofile="${build.dir}/lib/hadoop-core.jar" verbose="true"/>  
    <copy file="${hadoop.root}/lib/commons-cli-1.2.jar"  todir="${build.dir}/lib" verbose="true"/>  
    <copy file="${hadoop.root}/lib/commons-lang-2.4.jar"  todir="${build.dir}/lib" verbose="true"/>  
    <copy file="${hadoop.root}/lib/commons-configuration-1.6.jar"  todir="${build.dir}/lib" verbose="true"/>  
    <copy file="${hadoop.root}/lib/jackson-mapper-asl-1.8.8.jar"  todir="${build.dir}/lib" verbose="true"/>  
    <copy file="${hadoop.root}/lib/jackson-core-asl-1.8.8.jar"  todir="${build.dir}/lib" verbose="true"/>  
    <copy file="${hadoop.root}/lib/commons-httpclient-3.0.1.jar"  todir="${build.dir}/lib" verbose="true"/> 
    <jar
      jarfile="${build.dir}/hadoop-${name}-${version}.jar"
      manifest="${root}/META-INF/MANIFEST.MF">
      <fileset dir="${build.dir}" includes="classes/ lib/"/>
      <fileset dir="${root}" includes="resources/ plugin.xml"/>
    </jar>
  </target>

 

    找到src\contrib\build-contrib.xml,添加以下几行:

    

  <property name="version" value="1.1.1"/>
  <property name="ivy.version" value="2.1.0"/>
  <property name="eclipse.home" location="E:\\eclipse\\"/>

    eclipse的路径请换成你主机上的eclipse存放路径。

    找到MANIFEST.MF,编辑classpath:

Bundle-ClassPath: classes/,
lib/hadoop-core.jar,
lib/commons-cli-1.2.jar,
lib/commons-configuration-1.6.jar,
lib/commons-httpclient-3.0.1.jar,
lib/commons-lang-2.4.jar,
lib/jackson-core-asl-1.8.8.jar,
lib/jackson-mapper-asl-1.8.8.jar

    然后,打开命令行,进入目录\src\contrib\eclipse-plugin,输入ant编译,如果一切正常就编译通过了。

    最后可以在{hadoophome}\build\contrib\eclipse-plugin路径下找到编译好的插件。

 

四. 几个注意点

    1. 一定要在网络环境下进行,如果需要设置上网代理,可以在src\contrib\build-contrib.xml中添加如下几行:

<target name="proxy" >
      <property name="proxy.host" value=""/>
    <property name="proxy.port" value="80"/>
    <property name="proxy.user" value=""/>
    <property name="proxy.pass" value=""/>
    <setproxy proxyhost="${proxy.host}" proxyport="${proxy.port}"
      proxyuser="${proxy.user}" proxypassword="${proxy.pass}"/>
  </target>

    在xml文件中的ivy相关文件的下载任务中,添加以上代理任务的依赖,配置为:

<target name="ivy-download" depends="proxy" description="To download ivy " unless="offline">
    <get src="${ivy_repo_url}" dest="${ivy.jar}" usetimestamp="true"/>
  </target>

    2. 如果出现编译提示类的版本不匹配的问题,请确认你的java版本大于1.6。

最后,如果各位的eclipse版本也是indigo,hadoop版本也是1.1.1,又懒得自己编译了,那么我编译好的插件下载地址如下:

http://download.csdn.net/detail/qt03061127/4874838

http://download.csdn.net/detail/qt03061127/4878614

  

    

posted @ 2012-12-11 21:41  tadoo  阅读(247)  评论(0编辑  收藏  举报