ubuntu安装hadoop(伪分布)
一、首先安装jdk。(javaeye里看到的,列出来很多方法,我用这个成功了,就写这了)
1、到官方网站下载最新版本JDK的.bin文件:
http://www.oracle.com/technetwork/java/javase/downloads/index.html
2、为.bin文件添加x权限: chmod a+x /path/xxxx.bin
3、执行.bin文件,确认License 后开始安装 :./xxxx.bin
4、在/etc/profile文件中添加如下内容:
export JAVA_HOME=/opt/jdk-1.5.0
export PATH=$JAVA_HOME/bin:$PATH
5、执行 source /etc/profile;
6、 执行java、javac 你就看到了熟悉的信息;
二、安装hadoop(英文好的去看官方主页,我也就是个翻译)
ubuntu安装一下两个东东:
$ sudo apt-get install ssh
$ sudo apt-get install rsync
安装ssh的时候遇到个问题:(搜到答案:http://forum.ubuntu.org.cn/viewtopic.php?t=349282)
輸入了
"apt-get install openssh-server", 出現了下列訊息:
-------------------------------
Reading package lists... Done
Building dependency tree
Reading state information... Done
Package openssh-server is not available, but is referred to by another package.
This may mean that the package is missing, has been obsoleted, or
is only available from another source
E: Package 'openssh-server' has no installation candidate
-----------------
执行如下两条命令后,解决:
sudo
apt-get update
sudo apt-get install ssh
继续:
下载hadoop包:
http://hadoop.apache.org/common/releases.html
我用的hadoop-0.20.203.0
下载解压,tar zxvf hadoop-0.20.203.0rc1.tar.gz
然后配置 hadoop下的conf/hadoop-env.sh
配置里面的JAVA_HOME ,其中有一行注释掉的,你把前面的#删掉,等号后面改成自己刚才安装的jdk目录就好了。
然后执行hadoop下的,bin/hadoop
有usage说明安装成功了~