随笔 - 402  文章 - 1 评论 - 20 阅读 - 113万
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

hadoop的伪分布安装:一台实体机或虚拟机的安装。

环境:Windows7、VMWare、CentOS

1.1 设置ip地址

  说明:在CentOS中的网络的类型:

    仅主机模式:虚拟机在Windows外单独建立一个网

    桥接模式:虚拟机的IP和Windows的IP在同一个局域网的同一网段,并且IP不能冲突,虚拟机可以访问Windows里的文件。

  前期:在Windows中

                

                在装好的CentOS中

      

  开始:执行命令 service network restart
           验证: ifconfig
1.2 关闭防火墙
  执行命令 service iptables stop
  验证: service iptables status
1.3 关闭防火墙的自动运行
  执行命令 chkconfig iptables off
  验证: chkconfig --list | grep iptables
1.4 设置主机名
  执行命令 (1)hostname hadoop0
       (2)vi /etc/sysconfig/network(重启CentOS后,主机名改为hadoop0)
1.5 ip与hostname绑定
  执行命令 vi /etc/hosts

   
  验证:  ping 192.168.80.100或者ping hadoop0(在Windows中cmd命令行中ping hadoop0有错,那么找到C:\Windows\System32\drivers\etc的host文件进行修改)

  

   
1.6 设置ssh免密码登陆
  执行命令 (1)ssh-keygen -t rsa
       (2)cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
  验证: ssh hadoop0
1.7 安装jdk(这里用到了一个软件WinSCP,Windows和Linux之间可以互传文件)

   
  执行命令 (1)cd /usr/local
       (2)chmod u+x jdk-6u24-linux-i586.bin //先修改权限
       (3)./jdk-6u24-linux-i586.bin //安装
       (4)mv jdk-1.6.0_24 jdk   //为了方便,修改jdk-1.6.0_24名称为jdk
       (5)vi /etc/profile (设置环境变量)增加内容如下:
        export JAVA_HOME=/usr/local/jdk
        export PATH=.:$JAVA_HOME/bin:$PATH

   
       (6)source /etc/profile
  验证: java -version
1.8 安装hadoop
  执行命令 (1)tar -zxvf hadoop-1.1.2.tar.gz   //解压并安装
       (2)mv hadoop-1.1.2 hadoop
       (3)vi /etc/profile (设置i环境变量)增加内容如下:
        export JAVA_HOME=/usr/local/jdk
        export HADOOP_HOME=/usr/local/hadoop
        export PATH=.:$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH
       (4)source /etc/profile
       (5)修改conf目录下的配置文件hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml

                       

       说明:<value>hdfs://hadoop0:9000</value>中的hadoop0是你设置的hostname.

       

       

                
       (6)hadoop namenode -format
       (7)start-all.sh
  验证: (1)执行命令jps 如果看到5个新的java进程,分别是NameNode、SecondaryNameNode、DataNode、JobTracker、TaskTracker

      
      (2)在浏览器查看,http://hadoop0:50070 或者http://hadoop0:50030
1.9 启动时没有NameNode的可能原因:
  (1)没有格式化
  (2)环境变量设置错误
  (3)ip与hostname绑定失败

posted on   chamie  阅读(1047)  评论(0编辑  收藏  举报
编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
点击右上角即可分享
微信分享提示