安装运行Hadoop

1 准备环境

1.1 Ubuntu 或者 VMware Workstation Pro+Ubuntu

1.2 Jdk

1.3 eclipse 或其他开发工具（可选）

2 安装Hadoop

2.1 从http://hadoop.apache.org/下载hadoop-2.7.3.tar.gz（或其他版本）

2.2 解压压缩包hadoop-2.7.3.tar.gz到/opt/hadoop-2.7.3(或其他自定义文件夹）

解压命令： tar -zxvf hadoop-1/2.x.x.tar.gz

安装Hadoop完成

3 运行Hadoop

3.1 把要执行的jar包放到/opt/hadoop-2.7.3 目录

3.2 创建/opt/hadoop-2.7.3/input 目录，本例子还需要放一个包含一些字符的文本文档到input目录（具体例子见下一篇笔记）

3.3 进入/opt/hadoop-2.7.3/bin目录执行 hadoop jar wordcount.jar wordcount.MyJob input output 命令

wordcount.jar 是jar包的名称

wordcount.MyJob 是要执行的类的名称

3.4 执行命令后终端输出 JobClient：Job complete： job_xxx_xxx,并且output目录有一个文件名类似于part-r-xxxxx的文件，说明MapReduce程序运行成功

posted @ 2016-12-27 22:43 ~~Cc 阅读(125) 评论(0) 编辑收藏举报

刷新页面返回顶部