一. Windows10环境下安装 

    1.  下载安装JDK1.8,并配置环境变量,注意:JAVA_HOME环境变量配置的路径不要包含空格,C盘中的Program Files目录名称可用PROGRA~1代替即

    2.  下载Hadoop镜像安装文件,下载地址:镜像文件

 
 

3.  解压Hadoop镜像文件到磁盘目录下,注意:可以解压在非C盘下,存储目录不要包含中文和空格

4.  配置HADOOP_HOME环境变量,并在系统环境变量Path中添加Hadoop环境变量

 
 
 
 

5. 打开cmd窗口,输入hadoop version命令验证

 
 

备注: 若出现 Error: JAVA_HOME is incorrectly set. Please update F:\hadoop\conf\hadoop-env.cmd的报错,则是因为JAVA_HOME环境变量配置的路径含有空格的原因,请参考步骤1

6.  Hadoop伪分布式部署配置

 a.  下载windows专用二进制文件和工具类依赖库: hadoop在windows上运行需要winutils支持和hadoop.dll等文件

    https://github.com/steveloughran/winutils

     在github仓库中找到对应版本的二进制库hadoop.dll和winutils.exe文件,然后把文件拷贝到hadoop解压的bin目录中去

注意:  hadoop.dll等文件不要与hadoop冲突,若出现依赖性错误可以将hadoop.dll放到C:\Windows\System32下一份

   b.  修改etc目录下的core-site.xml文件 

   <configuration>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

    <property>

        <name>dfs.namenode.name.dir</name>

        <value>/E:/tools/hadoop-3.1.2/hadoop-3.1.2/data/dfs/namenode</value>

    </property>

    <property>

      <name>dfs.datanode.data.dir</name>

      <value>/E:/tools/hadoop-3.1.2/hadoop-3.1.2/data/dfs/datanode</value>

    </property>

  </configuration>

  注意:windows目录路径要改成使用正斜杠,且磁盘名称最前面也需要一个正斜杠

   c.  修改hdfs-site.xml配置文件

     <configuration>

   <property>

    <name>hadoop.tmp.dir</name>

    <value>/E:/tools/hadoop-3.1.2/hadoop-3.1.2/data</value>

    <description>存放临时数据的目录,即包括NameNode的数据</description>

    </property>

   <property>

    <name>fs.defaultFS</name>

    <value>hdfs://localhost:9000</value>

   </property>

   </configuration>

    注意:windows目录路径要改成使用正斜杠,且磁盘名称最前面也需要一个正斜杠

   d.   节点格式化

        在cmd窗口执行命令:hdfs namenode -format

       执行成功结果:

 
 
 
多出data文件夹

 7. 启动&关闭Hadoop

     a.  进入Hadoop的sbin目录下执行start-dfs.cmd启动Hadoop     

     b.  Web界面查看HDFS信息,在浏览器输入http://localhost:9870/,可访问NameNode