暑假学习二 8.24 Hadoop的环境配置
今日学习内容:
主要为Hadoop的环境配置,相关配置所需文档可以留言(?)会给发送
1.hadoop介绍:
狭义:
核心组件,Hadoop
hdfs 分布存储
yarn 资源管理和任务调度框架
mapreduce 计算 (企业基本不再直接使用)
广义:
围绕Hadoop打造的大数据生态圈
Hadoop发行版本:
开源社区:http://hadoop.apache.org/
商业版本:cloudera和hortonworks
Hadoop架构变迁:
1.0-2.0框架优化
2.0-3.0性能优化
2.Hadoop集群概述:
包括,hdfs,yarn 逻辑上分离,物理上在一起,标准的主从架构集群
不存在mapreduce集群,mapreduce是计算框架,位于代码层面,不存在集群的说法
3.Hadoop集群的安装
下载网址;Index of /dist/hadoop/common/hadoop-3.3.0 (apache.org)
课程提供了安装包,有编译好的安装包。
3.1集群角色规划
3.2基础环境准备
部分提前配置过了,以下是验证:
免密登录ssh:
时间同步:
创建统一工作目录:
安装jdk在三台机器上:
node1:先拖动导server目录下
解压并且验证安装:
拷贝到node2下jdk:
node3:修改上面的node2为node3即可
拷贝环境变量:
3.3 拷贝结束后同时重新加载环境变量
使用命令:
source /etc/profile
下面主要通过node1安装,node2,node3通过scp命名
3.4 上传Hadoop资源并且解压:
3.5Hadoop环境配置
配置三类文件:
编辑环境变量
将配置完成后的文件夹以及profile都发送到另外两台机器
至此完成Hadoop的配置文件的修改,并且保证了三台机器都可以识别Hadoop命令
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!