安装Hadoop

作业要求来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223

利用拓扑图来简要说明分布式Hadoop的master和多个slave节点的连接关系，结果如下图所示：

图3.1 Hadoop集群拓扑图

在单机版的Hadoop的基础上，优先配置好IP地址，效果截图所示：

图3.2伪分布式Hadoop配置IP地址

将相关的文件更改配置后，进行首次的格式化并进行启动，效果截图所示：

图3.3 启动Hadoop

启动后，通过jps来判断是否启动成功，若启动成功，则有DataNode，NameNode，secondaryNameNode，否则不成功，如下图为成功例子，效果截图所示：

图3.4 启动成功后的各种参数

通过浏览器输入192.168.5.60（伪分布式IP地址）：50070进行查看相应的文件：

图3.5 伪分布式Hadoop文件信息

1.选定一台为master，另一台为slave，两台都以ubantu为操作系统，

2.分别配置IP地址为192.168.5.70,192.168.5.71

3.在master节点上配置Hadoop用户并安装ssh server，安装java环境

4.将master节点的/usr/local/hadoop 目录复制到其他节点上

5.最后在master节点上，开启Hadoop

需要在master节点上启动Hadoop，输入如下命令start-dfs.sh,

start-yarn.sh,mr-jobhisory-daemon.sh start historyserver并截图查看效果：

图3.6启动Hadoop截图效果

查看启动进程，通过jps命令可以看出各个节点启动的进程，若在slave节点上看看到nodemanager和DataNode，则是成功，否则却少任意一个进程都表示失败，如下图以成功例子效果：

图3.7slave节点下的各个进程

通过web浏览器输入192.168.5.70（分布式IP地址）：50070进行查看NameNode和DataNode的状态：

图3.8 分布式Hadoop进程状态

通过web浏览器输入192.168.5.70：8088/clusterd，点击一系列的history连接，可以看到任务的运行信息

图3.9 通过web查看作业的信息

posted @ 2019-05-14 23:12 代码搬运小生阅读(257) 评论(0) 编辑收藏举报

刷新页面返回顶部