Linux环境Hadoop单机模式安装详解
单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置。在这种默认模式下所有3个XML文件均为空。当配置文件为空时,Hadoop会完全运行在本地。因为不需要与其他节点交互,单机模式就不使用HDFS,也不加载任何Hadoop的守护进程。该模式主要用于开发调试MapReduce程序的应用逻辑。
一、JDK安装与配置
详情请见:http://www.cnblogs.com/zhangwenjing/p/3580726.html
二、Hadoop安装与配置
1、Hadoop下载与安装
地址:http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.3.0/hadoop-2.3.0.tar.gz
使用wget命令下载:wget http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.3.0/hadoop-2.3.0.tar.gz
解压缩:tar -zxvf hadoop-2.3.0-src.tar.gz
重命名:mv hadoop-2.3.0-src hadoop
2、Hadoop配置
Hadoop配置在hadoop/etc/hadoop下,由于默认为单机模式,所以可以不做修改。现据实际情况作如下修改:
hadoop-env.sh
export JAVA_HOME=/usr/local/java/jdk1.7.0_51(JDK安装目录)
修改内存大小:export HADOOP_CLIENT_OPTS="-Xmx512m $HADOOP_CLIENT_OPTS"
3、实例运行
切换到安装目录,建立要上传到hadoop的两个文件 test1.txt、test2.txt
mkdir input
cd input
echo "hello world" > test1.txt
echo "hello hadoop" > test2.txt
运行hadoop自带的wordcount实例可以统计一批文本文件中单词出现的次数
bin/hadoop jar /opt/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.3.0.jar wordcount input output
查看结果:
cat output/*