hadoop基本介绍
四个主要模块:
common:工具类,rpc框架
hdfs:分布式文件系统,主从架构
主上面的进程:namenode、secondarynamenode(不过一般不跟namenode在一个节点)
从上面的进程:datanode
yarn:集群的资源调度框架,主从架构
主上面的进程:resourcemanager
从上面的进程:nodemanager
mapreduce:分布式计算框架,有计算任务的时候才会有相应进程
hdfs四大机制、2大核心
四大机制:
心跳机制
安全模式
机架策略:
负载均很
两大核心
上传
下载
元数据管理
元数据:
1.抽象目录树
2.数据和块的映射关系
3.数据块的存储关系
元数据存储的位置
内存:存储1、2、3
磁盘:存储1、2
hdfs dfsadmin -safemode enter:进入安全模式
hdfs dfsadmin -safemode leave:退出安全模式
hdfs dfsadmin -safemode get : 查询模式,处在安全模式返回on否则off