大数据学习笔记01-HDFS-集群安装
安装
- 下载 Hadoop,以2.7.5版本为例
- 在虚拟机上创建目录bigdata,即执行
mkdir bigdata
- 上传到master机器节点的目录~/bigdata下(可以用FileZilla等ftp工具上传)
- 解压:
tar -zxvf ~/bigdata/hadoop-2.7.5.tar.gz
修改配置文件
修改core-site.xml
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9999</value>
<description>表示HDFS的基本路径</description>
</property>
</configuration>
修改hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
<description>表示数据块的备份数量,不能大于DataNode的数量</description>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/home/hadoop-twq/bigdata/dfs/name</value>
<description>表示NameNode需要存储数据的地方</description>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/home/hadoop-twq/bigdata/dfs/data</value>
<description>DataNode存放数据的地方</description>
</property>
</configuration>
在master上创建创建nameNode和dataNode需要的文件目录
mkdir -p ~/bigdata/dfs/name
mkdir -p ~/bigdata/dfs/data
修改hadoop-env.sh
在hadoop-env.sh中添加JAVA_HOME: export JAVA_HOME=/usr/local/lib/jdk1.8.0_161
配置slaves
修改~/bigdata/hadoop-2.7.5/etc/hadoop/slaves,在slaves文件中写入如下内容:
slave1
slave2
在slave1和slave2节点中的hadoop-twq用户下的主目录下创建bigdata目录:
即执行mkdir bigdata
将master上配置好的hadoop分发到每一个slave上
scp -r ~/bigdata/dfs hadoop-twq@slave1:~/bigdata
scp -r ~/bigdata/dfs hadoop-twq@slave2:~/bigdata
scp -r ~/bigdata/hadoop-2.7.5 hadoop-twq@slave1:~/bigdata
scp -r ~/bigdata/hadoop-2.7.5 hadoop-twq@slave2:~/bigdata
配置环境变量
vi ~/.bash_profile:
export HADOOP_HOME=~/bigdata/hadoop-2.7.5
PATH=$PATH:$HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
source ~/.bash_profile
which hdfs
看看输出是否是:~/bigdata/hadoop-2.7.5/bin/hdfs
如果不是可能需要退出xshell,重新登录
运行hdfs
- 格式化: hdfs namenode -format
- 启动hdfs: 运行start-dfs.sh
- http://master:50070看下是否部署成功(master是域名映射,指向安装hadoop主机的ip)
- 停止hdfs: 运行stop-dfs.sh
God, Grant me the SERENITY, to accept the things I cannot change,
COURAGE to change the things I can, and the WISDOM to know the difference.
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
2016-08-29 PL/SQL developer(绿色版)安装及配置