HDFS 笔记

HDFS

Hadoop fs命令、

　　hadoop fs <>

三节点集群搭建。

本地文件系统与hdfs相隔离。

hdfs dfs <>

start-all.sh在哪里？

cd $HADOOP

/opt/bigdata/hadop-2.7.3/etc/hadoop

slaves文件内容看一看。

ssh node-02 -> datanode

？？？

jsp查看进程

hdfs原理：（面试）

fault recovery

每个快都会有副本。128M最大切分。

一个datanode对应一个机器？

hdfs-site.xml配置

configuration

文档：https://hadoop.apache.org/docs/r2.7.3

blk保存在机架的灵活性，如何配置。

机架感知。

副本零时性增多，提高吞吐量。

hadoop fs -settrep -R 4 /path

hdfa fsck /salary.txt -files -bllocks -locations

通过网页也可以查看：node-01:50070

4 HDFS 主从架构

读取方式

B1->dn1, dn2, dn3

B2->dn4,dn2, dn1

元数据->namenode 内存 namenode取回然后去各个block，组成hadoop.dat

HDFS适合大文件

HDFS有上限，因为每个元数据150Byte，而内存是有限的，故适合储存大文件

HDFS会将内存储存在硬盘上为了安全

Fsimage

Edits log

Secondary namenode

双缓存异步写

当t-t1>1h 触发Check-point

心跳机制

10min以上视为datanode挂掉

1小时 block report

短路径

官网

负载均衡

磁盘利用率差值变小

posted @ 2019-10-22 08:22 cschen588 阅读(129) 评论(0) 收藏举报

刷新页面返回顶部

HDFS 笔记

公告