04.hadoop - 随笔分类 - star521

006.hdfs-查看各节点磁盘使用情况,集群平衡

摘要：查看各节点磁盘使用情况 hdfs dfsadmin -report | grep -E "Name:|DFS Used%:" 集群平衡 mv balance.sh /home/hdfs/ su hdfs vim balance.sh chmod +x balance.sh ls hdfs dfsad 阅读全文

posted @ 2023-06-27 10:53 star521 阅读(239) 评论(0) 推荐(0)

001.hadoop-log4j.properties配置

摘要：resources下 log4j.properties 文件 log4j.rootCategory=ERROR, console log4j.appender.console=org.apache.log4j.ConsoleAppender log4j.appender.console.target 阅读全文

posted @ 2021-09-02 01:40 star521 阅读(448) 评论(0) 推荐(0)

001.如何通过进程号查看进程所依赖的jar包，cd /proc/92232/fd

摘要：[centos@s101 /proc/92232/fd]$jps 82100 JobHistoryServer 92983 NameNode 93783 Master 92232 DFSZKFailoverController 114094 Jps [centos@s101 /proc/92232/ 阅读全文

posted @ 2021-08-17 09:44 star521 阅读(236) 评论(0) 推荐(0)

02.spark-spark分布式安装

摘要：1.规划三台服务器 s101 //master(进程) s102 ~ s104 //worker(进程) 2.在每个主机上分别安装spark tar -zxvf /home/centos/download/spark-2.1.1-bin-hadoop2.7.tgz -C /soft/ ln -s 阅读全文

posted @ 2021-08-11 20:03 star521 阅读(152) 评论(0) 推荐(0)

HDFS分布式文件系统

摘要：1.块 2.namenode 名称节点 datanode数据节点第二名称节点解决Editlog不断增大的问题，并实现冷备份 1.名称节点出错第二名称节点备份数据节点出错名称节点把一台机器上的冗余备份数据复制一份，而且发生负载不均衡时还可以实现数据迁移数据出错校验码阅读全文

posted @ 2018-04-07 17:25 star521 阅读(166) 评论(0) 推荐(0)

hadoop 简介

摘要：恢复内容开始 Hadoop 两大核心：集群分布式存储分布式处理 Spark基于内存计算 MapReduce基于磁盘的计算 hive数据仓库--sql语句 pig流数据处理 sql语句（轻量级的） Oozie作业流调度系统 Hadoop安装恢复内容结束阅读全文

posted @ 2018-04-07 10:50 star521 阅读(141) 评论(0) 推荐(0)

star521

随笔分类 - 04.hadoop

公告