大数据（2）---HDFS集群搭建

一、准备工作

　　1.准备几台机器，我这里使用VMware准备了四台机器，一个name node，三个data node。

　　VMware安装虚拟机：https://www.cnblogs.com/nijunyang/p/12001312.html

　　2.Hadoop生态几乎都是用的java开发的，因此四台机器还需要安装JDK。

　　3.集群内主机域名映射，将四台机器的IP和主机名映射分别写到hosts文件中(切记主机名不要带非法字符，图片中的下划线”_”请忽略)

　　vim /etc/hosts

　　配好一个之后可以直接将这个复制到其他机器上面去，不用每台都去配置：

　　scp /etc/hosts nijunyang69:/etc/

　　scp /etc/hosts nijunyang70:/etc/

　　scp /etc/hosts nijunyang71:/etc/

二、hdfs集群安装

　　1.下载hadoop安装包到linux服务器上面，并进行解压，我这里使用的的2.8.5，

　　tar -zxvf hadoop-2.8.5.tar.gz

　　2.hadoop指定java环境变量：

　　hadoop-2.8.5/etc/hadoop/hadoop-env.sh 文件中指定java环境变量：

　　export JAVA_HOME=/soft/jdk1.8.0_191

　　3.配置核心参数：

默认参数：https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

　　　　1)指定hadoop的默认文件系统为：hdfs

　　　　2)指定hdfs的namenode节点为哪台机器

　　　　修改/etc/hadoop/core-site.xml 指定hadoop默认文件系统为hdfs,并且指定name node

　　　　<configuration>

　　　　　　<property>

　　　　　　　　<name>fs.defaultFS</name><!--指定默认文件系统hdfs-->

　　　　　　　　<value>hdfs://nijunyang68:9000/</value><!--指定name node为nijunyang_68-->

　　　　　　</property>

　　　　</configuration>

　　　　3) 指定namenode存储数据的本地目录

　　　　4) 指定datanode存放文件块的本地目录

　　　　修改/etc/hadoop/hdfs-site.xml

<configuration>

    <property>

    <name>dfs.namenode.name.dir</name>

    <value>/hadoop/hdpdata/name/</value>

    </property>

    <property>

    <name>dfs.datanode.data.dir</name>

    <value>/hadoop/hdpdata/data</value>

    </property>

</configuration>