Hadoop分布式部署——要点

这里只记录几个要点,比较容易出问题的地方。

1.各服务器必须有相同的用户(便于使用相同的用户ssh登录)
2.ssh互通,配置无密码登录ssh-keygen -t rsa,将id_rsa.pub的内容相互复制到各主机的authorized_keys文件中,注意设置authorized_keys的权限为600(必须的,不然ssh登录时还是提示密码);修改/etc/ssh/ssh_config配置文件,启用RSA和公钥认证方式,并重启sshd服务。(为了保证可以通过ssh登录其他服务器,启动或停止hadoop)
3.各主机配置好$HADOOP_HOME(用于ssh登录后确定Hadoop的安装路径),及$PATH环境变量,并配置好hadoop相关配置(这个参考官方的文档就可以了),在Master节点启动start-all.sh即可,注意防火墙开放相关端口,使用hadoop dfsadmin -report查看hadoop的运行状态。

 

详细的配置请参考园友的一篇文章(这是我见过最详细的配置文档了,绝对要推荐):

 http://www.cnblogs.com/xia520pi/archive/2012/05/16/2503949.html

posted @   StanZhai  阅读(510)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
· SQL Server 2025 AI相关能力初探
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库
点击右上角即可分享
微信分享提示