随笔分类 -  04.hadoop

摘要:查看各节点磁盘使用情况 hdfs dfsadmin -report | grep -E "Name:|DFS Used%:" 集群平衡 mv balance.sh /home/hdfs/ su hdfs vim balance.sh chmod +x balance.sh ls hdfs dfsad 阅读全文
posted @ 2023-06-27 10:53 star521 阅读(195) 评论(0) 推荐(0) 编辑
摘要:resources下 log4j.properties 文件 log4j.rootCategory=ERROR, console log4j.appender.console=org.apache.log4j.ConsoleAppender log4j.appender.console.target 阅读全文
posted @ 2021-09-02 01:40 star521 阅读(419) 评论(0) 推荐(0) 编辑
摘要:[centos@s101 /proc/92232/fd]$jps 82100 JobHistoryServer 92983 NameNode 93783 Master 92232 DFSZKFailoverController 114094 Jps [centos@s101 /proc/92232/ 阅读全文
posted @ 2021-08-17 09:44 star521 阅读(214) 评论(0) 推荐(0) 编辑
摘要:1.规划 三台服务器 s101 //master(进程) s102 ~ s104 //worker(进程) 2.在每个主机上分别安装spark tar -zxvf /home/centos/download/spark-2.1.1-bin-hadoop2.7.tgz -C /soft/ ln -s 阅读全文
posted @ 2021-08-11 20:03 star521 阅读(139) 评论(0) 推荐(0) 编辑
摘要:1.块 2.namenode 名称节点 datanode数据节点 第二名称节点解决Editlog不断增大的问题,并实现冷备份 1.名称节点出错 第二名称节点备份 数据节点出错 名称节点把一台机器上的冗余备份数据复制一份,而且发生负载不均衡时还可以实现数据迁移 数据出错 校验码 阅读全文
posted @ 2018-04-07 17:25 star521 阅读(150) 评论(0) 推荐(0) 编辑
摘要:恢复内容开始 Hadoop 两大核心:集群 分布式存储 分布式处理 Spark基于内存计算 MapReduce基于磁盘的计算 hive数据仓库--sql语句 pig流数据处理 sql语句(轻量级的) Oozie作业流调度系统 Hadoop安装 恢复内容结束 阅读全文
posted @ 2018-04-07 10:50 star521 阅读(132) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示