安装运行Hadoop

1 准备环境

1.1 Ubuntu 或者 VMware Workstation Pro+Ubuntu

1.2 Jdk

1.3 eclipse 或其他开发工具(可选)

2 安装Hadoop

2.1 从http://hadoop.apache.org/下载hadoop-2.7.3.tar.gz(或其他版本)

2.2 解压压缩包hadoop-2.7.3.tar.gz到/opt/hadoop-2.7.3(或其他自定义文件夹)

     解压命令: tar -zxvf hadoop-1/2.x.x.tar.gz

     安装Hadoop完成

3 运行Hadoop

3.1 把要执行的jar包放到/opt/hadoop-2.7.3 目录

3.2 创建/opt/hadoop-2.7.3/input 目录,本例子还需要放一个包含一些字符的文本文档到input目录(具体例子见下一篇笔记)

3.3 进入/opt/hadoop-2.7.3/bin目录  执行 hadoop jar wordcount.jar wordcount.MyJob input output 命令

     wordcount.jar  是jar包的名称

     wordcount.MyJob  是要执行的类的名称

3.4 执行命令后终端输出 JobClient:Job complete: job_xxx_xxx,并且output目录有一个文件名类似于part-r-xxxxx的文件,说明MapReduce程序运行成功

posted @ 2016-12-27 22:43  ~~Cc  阅读(125)  评论(0编辑  收藏  举报