yarn上运行mapreduce

1.准备一台客户机
2.安装JDK和hadoop
3.配置环境变量
4.配置集群在yarn上运

　　4.1配置环境变量
yarn-env.sh 增加exprt JAVA_HOME=
mapred-env.sh 增加exprt JAVA_HOME=

　　4.2配置集群环境

　　　　由于yarn包含resourceManager和nodeManager\ApplicationManager以及Container，因此在此处先配置resourceManager和nodeManager

　　　　a.配置yarn-site.xml　　　

　　　　　　<name>yarn.nodemanager.aux-services</name>

　　　　　　 <value>mapreduce_shuffle</value>

　　　　</property>

　　　　　　<name>yarn.resourcemanager.hostname</name>

<value>hadoop101</value>

　　　　</property>

　　　　b.配置 mapred-site.xml

<property>
　　　　 <name>mapreduce.framework.name</name>
　　　　<value>yarn</value>
　　　　</property>

</property>
5.启动、测试集群增删查

　　5.1启动（注意启动前必须要先启动集群，既namenode和datanode）

　　　　（a）启动resourcemanager

　　　　sbin/yarn-daemon.sh start resourcemanager

　　　　（b）启动nodemanager

　　　　sbin/yarn-daemon.sh start nodemanager

　　　　（c）查看（展示MapReduce的运行进程）

　　　　　　http://hadoop101:8088
6.在yarn上运行程序

　　hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /user/atguigu/input/ /user/atguigu/output

posted @ 2019-09-26 15:41 行走看世界阅读(432) 评论(0) 收藏举报

刷新页面返回顶部