6 hadoop1.0配置文件详解

hadoop1.0配置文件详解

1 修改hadoop-env.sh
配置 Hadoop 运行所需的环境变量
# The java implementation to use.  
export JAVA_HOME=${JAVA_HOME}

2 配置core-site.xml
Hadoop 核心全局配置文件,可在其他配置文件中引用该文件
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://vm1:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hdfs/tmp</value>
</property>
</configuration>

fs.default.name:这是一个描述集群中NameNode结点的URI(包括协议、主机名称、端口号),集群里面的每一台机器都需要知道NameNode的地址。DataNode结点会先在NameNode上注册,这样它们的数据才可以被使用。独立的客户端程序通过这个URI跟DataNode交互,以取得文件的块列表
hadoop.tmp.dir:这里的路径默认是NameNode、DataNode等存放数据的公共目录。用户也可以自己单独指定这三类节点的目录。其默认位置在/tmp/{user}下。若此处不设置该属性,某些linux重启后,由于tmp目录会被清空,会发生文件无法找到的错误发生。


3 配置hdfs-site.xml
HDFS配置文件,继承 core-site.xml 配置文件

<configuration>
<property>
<name>dfs.name.dir</name>
<value>/home/hdfs/dfs/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/home/hdfs/data</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
</configuration>


4 配置mapred-site.xml
MapReduce配置文件,继承 core-site.xml 配置文件
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>vm1:9001</value>
</property>
</configuration>


5 配置master
vm1

6 配置slave
vm2
vm3

 

posted @ 2022-11-09 17:16  Sky-wings  阅读(29)  评论(0编辑  收藏  举报