Mahout安装(Hadoop 1.2.1 版本)
1 安装环境
Hadoop1.2.1 分布式集群环境下安装(192.168.1.53-56)
Mahout 0.9
2 安装介质
下载地址:http://archive.apache.org/dist/mahout/0.9/
文件名(二进制):mahout-distribution-0.9.tar.gz
3 安装步骤
3.1 上传安装介质:
#rz
上传目录为:/home/hadoop/
3.2 解压到相关目录
#cd /app/hadoop/
#mkdir mahout
#tar -zxvf /home/hadoop/mahout-distribution-0.9.tar.gz
重新命名解压的文件
# mv mahout-distribution-0.9/ ./mahout
3.3 配置环境变量
1、配置
# vi /etc/profile
添加以内容:
export HADOOP_CONF_DIR=/app/hadoop/hadoop/conf
#Mathout
export MAHOUT_HOME=/app/hadoop/mahout
export MAHOUT_CONF_DIR=/app/hadoop/mahout/conf
export PATH=$PATH:$MAHOUT_HOME/conf:$MAHOUT_HOME/bin
//生效配置文件
#source /etc/profile
2、分别将:mahout复制到(192.168.1.54-56)
#tar -zcvf mahout.tar.gz ./mahout
#scp mahout.tar.gz hadoop@192.168.1.54:/app/hadoop/
分别在(54-56执行解压)
#tar -zxvf mahout.tar.gz
3、分别在192.168.1.54-56(重复第1步环境变量配置)
(注:#source /etc/profile)
3.4 启动Hadoop
#./start-all.sh
#jps
3.5 验证是否安装成功
#mahout –help
4 测试验证
4.1 下载测试数据
#wget http://archive.ics.uci.edu/ml /databases/synthetic_control /synthetic_control.data
4.2 将文件存储到HDFS
#hadoop fs -mdkir testdata
#hadoop fs -put /home/hadoop/synthetic_control.data testdata
#hadoop fs -ls testdata
4.3 运行mahout
#mahout org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
4.4 查看结果
#hadoop fs -ls ouput