linux 安装 hadoop

一、首先jdk路径配置好，注意jdk与系统位数对应起来，一开始我安装的jdk是32位，与系统不匹配，导致像hdfs上传文件命令执行不成功。

二、hadoop安装

1）进入到 Hadoop 安装包路径下：

[root@hadoop101 ~]# cd /opt/software/

2）解压安装文件到/opt/module 下面

[root@hadoop101 software]# tar -zxf hadoop-2.7.2.tar.gz -C /opt/module/

3）查看是否解压成功

[root@hadoop101 software]# ls /opt/module/

hadoop-2.7.2

4）在/opt/module/hadoop-2.7.2/etc/hadoop 路径下配置 hadoop-env.sh

（1）Linux 系统中获取 jdk 的安装路径：

[root@hadoop101 jdk1.8.0_144]# echo $JAVA_HOME

/opt/module/jdk1.8.0_144

（2）修改 hadoop-env.sh 文件中 JAVA_HOME 路径：

[root@hadoop101 hadoop]# vi hadoop-env.sh

修改 JAVA_HOME 如下

export JAVA_HOME=/opt/module/jdk1.8.0_144

5）将 hadoop 添加到环境变量

（1）获取 hadoop 安装路径：

[root@ hadoop101 hadoop-2.7.2]# pwd

/opt/module/hadoop-2.7.2

（2）打开/etc/profile 文件：

[root@ hadoop101 hadoop-2.7.2]# vi /etc/profile

在 profie 文件末尾添加 jdk 路径：（shitf+g）

##HADOOP_HOME

export HADOOP_HOME=/opt/module/hadoop-2.7.2

export PATH=$PATH:$HADOOP_HOME/bin

export PATH=$PATH:$HADOOP_HOME/sbin

（3）保存后退出：

:wq

（4）让修改后的文件生效：

[root@ hadoop101 hadoop-2.7.2]# source /etc/profile

（5）重启(如果 hadoop 命令不能用再重启)：

[root@ hadoop101 hadoop-2.7.2]# sync

[root@ hadoop101 hadoop-2.7.2]# reboot

6）修改/opt 目录下的所有文件所有者为 atguigu

[root@hadoop101 opt]# chown atguigu:atguigu -R /opt/

7）切换到 atguigu 用户

[root@hadoop101 opt]# su atguigu

Hadoop 运行模式

1）官方网址

（1）官方网站：

http://hadoop.apache.org/

（2）各个版本归档库地址

https://archive.apache.org/dist/hadoop/common/hadoop-2.7.2/

（3）hadoop2.7.2 版本详情介绍

http://hadoop.apache.org/docs/r2.7.2/

2）Hadoop 运行模式

（1）本地模式（默认模式）：

不需要启用单独进程，直接可以运行，测试和开发时使用。

（2）伪分布式模式：

等同于完全分布式，只有一个节点。

（3）完全分布式模式：

多个节点一起运行。

本地运行 Hadoop 案例

官方 grep 案例

1）创建在 hadoop-2.7.2 文件下面创建一个 input 文件夹

[atguigu@hadoop101 hadoop-2.7.2]$mkdir input

2）将 hadoop 的 xml 配置文件复制到 input

[atguigu@hadoop101 hadoop-2.7.2]$cp etc/hadoop/*.xml input

3）执行 share 目录下的 mapreduce 程序

[atguigu@hadoop101 hadoop-2.7.2]$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input output 'dfs[a-z.]+'

4）查看输出结果

[atguigu@hadoop101 hadoop-2.7.2]$ cat output/*

官方 wordcount 案例

1）创建在 hadoop-2.7.2 文件下面创建一个 wcinput 文件夹

[atguigu@hadoop101 hadoop-2.7.2]$mkdir wcinput

2）在 wcinput 文件下创建一个 wc.input 文件

[atguigu@hadoop101 hadoop-2.7.2]$cd wcinput

[atguigu@hadoop101 wcinput]$touch wc.input

3）编辑 wc.input 文件

[atguigu@hadoop101 wcinput]$vim wc.input

在文件中输入如下内容

hadoop yarn

hadoop mapreduce

atguigu

保存退出：：wq

4）回到 hadoop 目录/opt/module/hadoop-2.7.2

5）执行程序：

[atguigu@hadoop101 hadoop-2.7.2]$ hadoop jar

share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput wcoutput

6）查看结果：

[atguigu@hadoop101 hadoop-2.7.2]$cat wcoutput/part-r-00000

atguigu 2

hadoop 2

mapreduce 1

yarn 1

伪分布式运行 Hadoop 案例

启动 HDFS 并运行 MapReduce 程序

1）分析：

（1）准备 1 台客户机

（2）安装 jdk

（3）配置环境变量

（4）安装 hadoop

（5）配置环境变量

（6）配置集群

（7）启动、测试集群增、删、查

（8）执行 wordcount 案例

2）执行步骤

需要配置 hadoop 文件如下

（1）配置集群

（a）配置：hadoop-env.sh

Linux 系统中获取 jdk 的安装路径：

[root@ hadoop101 ~]# echo $JAVA_HOME

/opt/module/jdk1.8.0_144

修改 JAVA_HOME 路径：

export JAVA_HOME=/opt/module/jdk1.8.0_144

（b）配置：core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://hadoop101:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/opt/module/hadoop-2.7.2/data/tmp</value>

</property>

（c）配置：hdfs-site.xml

<name>dfs.replication</name>

</property>

（2）启动集群

（a）格式化 namenode（第一次启动时格式化，以后就不要总格式化）

[atguigu@hadoop101 hadoop-2.7.2]$ bin/hdfs namenode -format

（b）启动 namenode

[atguigu@hadoop101 hadoop-2.7.2]$ sbin/hadoop-daemon.sh start namenode

（c）启动 datanode

[atguigu@hadoop101 hadoop-2.7.2]$ sbin/hadoop-daemon.sh start datanode

（3）查看集群

（a）查看是否启动成功

[atguigu@hadoop101 hadoop-2.7.2]$ jps

13586 NameNode

13668 DataNode

13786 Jps

（b）查看产生的 log 日志

当前目录：/opt/module/hadoop-2.7.2/logs

[atguigu@hadoop101 logs]$ ls

hadoop-atguigu-datanode-hadoop.atguigu.com.log

hadoop-atguigu-datanode-hadoop.atguigu.com.out

hadoop-atguigu-namenode-hadoop.atguigu.com.log

hadoop-atguigu-namenode-hadoop.atguigu.com.out

SecurityAuth-root.audit

[atguigu@hadoop101 logs]# cat hadoop-atguigu-datanode-hadoop101.log

（c）web 端查看 HDFS 文件系统

http://192.168.1.101:50070/dfshealth.html#tab-overview

注意：如果不能查看，看如下帖子处理

http://www.cnblogs.com/zlslch/p/6604189.html

（4）操作集群

（a）在 hdfs 文件系统上创建一个 input 文件夹

[atguigu@hadoop101 hadoop-2.7.2]$ bin/hdfs dfs -mkdir -p /user/atguigu/input

（b）将测试文件内容上传到文件系统上

[atguigu@hadoop101 hadoop-2.7.2]$ bin/hdfs dfs -put wcinput/wc.input

/user/atguigu/input/

（c）查看上传的文件是否正确

[atguigu@hadoop101 hadoop-2.7.2]$ bin/hdfs dfs -ls /user/atguigu/input/

[atguigu@hadoop101 hadoop-2.7.2]$ bin/hdfs dfs -cat /user/atguigu/

input/wc.input

（d）运行 mapreduce 程序

[atguigu@hadoop101 hadoop-2.7.2]$ bin/hadoop jar

share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /user/atguigu/input/

/user/atguigu/output

（e）查看输出结果

命令行查看：

[atguigu@hadoop101 hadoop-2.7.2]$ bin/hdfs dfs -cat /user/atguigu/output/*

浏览器查看

（f）将测试文件内容下载到本地

[atguigu@hadoop101 hadoop-2.7.2]$ hadoop fs

-get /user/atguigu/

output/part-r-00000 ./wcoutput/

或者执行

bin/hdfs dfs -get /user/hejj1/output/p* wcinput/

（g）删除输出结果

[atguigu@hadoop101 hadoop-2.7.2]$ hdfs dfs -rm -r /user/atguigu/output

三、hadoop运行模式

本地运行 Hadoop 案例

官方 grep 案例

官方 wordcount 案例

伪分布式运行 Hadoop 案例

启动 HDFS 并运行 MapReduce 程序

1）分析：

（1）准备 1 台客户机

（2）安装 jdk

（3）配置环境变量

（4）安装 hadoop

（5）配置环境变量

（6）配置集群

（7）启动、测试集群增、删、查

（8）执行 wordcount 案例

posted @ 2020-05-27 16:54 每天进步一点点_hejj 阅读(842) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· winform 绘制太阳，地球，月球运作规律
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具

2025年3月

日

一

二

三

四

五

六

公告

昵称：每天进步一点点_hejj
园龄： 5年7个月
粉丝： 8
关注： 4

+加关注

每天进步一点点_hejj

成长，开心，快乐

linux 安装 hadoop

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论