CDH3安装手记

环境是在vmware7下实现,操作系统是fedora14 (尼玛12、13都有试过,因为yum源的问题,好些rpm包都给自己找,伤不起..)

闲话少说,干活!

1、先保证你的yum源是最新可用的,这样可以省好多事,例如pax, patch, python-setuptools都会被CDH3组件依赖。

2、安装jdk, jre。 但对非RPM版本的不认,在安装CDH3的时候会提示缺少sun-java6。安装rpm包后可继续,但我想会有解决办法,如果哪位有答案请留言,万分感谢!

3、添加cloudera的yum源,当然你是专业的系统工程师且很有闲的话,也可以自己下在管理RPM包。如果不是,咱们赶时间吧!

sudo vim /etc/yum.repos.d/cloudera.repo

添加以下

[cloudera-cdh3u0]
name=Cloudera's Distribution for Hadoop
baseurl=http://cdh3u0.cloudera.com/redhat/cdh/3/
gpgkey = http://cdh3u0.cloudera.com/redhat/cdh/RPM-GPG-KEY-cloudera
gpgcheck = 1

cdh3u0似乎是现时最新的版本,我试过将cdh3u0改成archive,对比一下下载下来的rpm包的版本号,没有任何区别,但archive有次中断不可用,坑死爹了。

4、安装cdh3

sudo yum search hadoop

可以看到hadoop相关的软件包,这里暂时不表,安装之

sudo yum install hadoop-0.20

你也可以根据需求有选择安装hadoop的组件,例如:hadoop-0.20-namenode、 hadoop-0.20-jobtracker

一路yes,安装完毕。( 注:但我估计很多哥们都会有一些依赖的rpm包找不到的情况。先检讨一下自己的人品,然后去找一个最新的yum源或者人肉下载那些rpm包。)

5、安装ssh, 实现无密码登录

sudo yum -y install openssh

sudo service sshd start

sudo chkconfig --level 35 sshd on

# 配置无密码登录

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

chmod 600 ~/.ssh/authorized_keys

# 关闭防火墙

sudo service iptables stop

sudo chkconfig --level 35 iptables off 

# 然后登录验证

ssh localhost 

# 同理、将master的id_dsa.pub添入slave的authorized_keys

scp ~/.ssh/id_dsa.pub cdh@cdh3-slave1:/home/cdh

# 登录cdh3-slave1

cat ~/id_dsa.pub >> ~/.ssh/authorized_keys

chmod 600 ~/.ssh/authorized_keys

最后说明、安装完毕的只是cdh3的standalone模式,也就是单机模式(此外还有伪分布式模式,和分布式模式),单机下可以执行mapreduce任务,但没有启动hdfs的服务,切换模式需要使用CDH3的配置管理工具alternatives来进行conf切换,它最大的好处是轻松管理hadoop集群的配置。

posted on 2011-04-24 17:21  张淼  阅读(1660)  评论(0编辑  收藏  举报