Hadoop初级之Hadoop伪分布安装

在opt下创建文件夹hadoopdata用于存放hadoop的一些元数据
上传hadoop压缩包到opt下，解压
解压完成为
进入以下路径，做一些配置修改 ./hadoop-2.7.2/etc/hadoop/
编辑hadoop-env.sh 配置自己jdk路径
编辑core-site.xml ，配置ip，端口，读取文件缓冲大小

<name>fs.defaultFS</name>

</property>

<name>io.file.buffer.size</name>

</property>

编辑hdfs-site.xml，配置副本数等。看图

<name>dfs.replication</name>

</property>

<name>dfs.namenode.name.dir</name>

<value>file:///opt/hadoopdata/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:///opt/hadoopdata/dfs/data</value>

</property>

<name>dfs.http.address</name>

</property>

<name>dfs.secondary.http.address</name>

</property>

<name>dfs.webhdfs.enabled</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

13.cp mapred-site.xml.template mapred-site.xml

14.

15.编辑mapred-site.xml，配置框架名字，历史记录组件等

16.

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

</property>

<name>mapreduce.job.ubertask.enable</name>

</property>

<name>mapreduce.job.ubertask.maxmaps</name>

</property>

<name>mapreduce.job.ubertask.maxreduces</name>

</property>

编辑yarn-site.xml ，配置resourcemanager的相关信息

<name>yarn.resourcemanager.hostname</name>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.resourcemanager.address</name>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

</property>

<name>yarn.resourcemanager.admin.address</name>

</property>

<name>yarn.resourcemanager.webapp.address</name>

</property>

<name>yarn.log-aggregation-enable</name>

</property>

<name>yarn.log-aggregation.retain-seconds</name>

</property>

<name>yarn.log-aggregation.retain-check-interval-seconds</name>

</property>

<name>yarn.nodemanager.log.retain-seconds</name>

</property>

<name>yarn.nodemanager.remote-app-log-dir</name>

<value>/opt/hadoopdata/logs</value>

</property>

编辑slaves，将三台虚拟机的主机名添加进去
配置映射信息
vim /etc/hosts
将配置好的hadoop-2.7.2 发送给其他节点
3台机器都配置环境变量
vim /etc/profile
配置ssh免登陆

生成ssh免登陆密钥

ssh-keygen -t rsa （四个回车）

//执行完这个命令后，会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）

//将公钥拷贝到要免登陆的机器上

ssh-copy-id localhost

jh01 namenode\resourcemanager\datanode\nodemanager（要启动的服务）

jh02 secondaryNamenode\datanode\nodemanager

jh03 datanode\nodemanager

jh01 免登录jh02和jh03和自己

jh02 免登录jh03和自己

jh03 免登录自己

hadoop namenode -format
（格式化namenode）

32.start-all.sh

（开启服务）

33.12.通过web UI查看HDFS和yarn集群是否正常

posted @ 2019-07-22 11:44 好男孩zxn 阅读(320) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

好男孩zxn

Hadoop初级之Hadoop伪分布安装

公告