HDFS 构架笔记(一)

HDFS分为Master(NameNode/NN) +N个Slaves(DataNode/DN)

 

集群里只有一个机器上运行NN,其他每台机器上运行一个DN(也可以一个机器上运行多个DN,但生产环境中不建议这么做),一个DN切割n个Block,DN中的Block,只有最后一个才有可能大小不一,其他是一样的,block的默认大小是128,也可以自行设置

 

NN职责:

1、负责客户端请求的响应

2、负责元数据(文件的名称、副本的系数、Block存放的DN)的管理

DN职责:

1、存储用的文件对应的数据块(Block)

2、要定期向NN发送心跳信息,汇报本身及其所有的Block信息。健康状态

 

 

1个文件会被拆分成多个Block

1个Block默认大小是128M

例:一个文件是130M>>2个Block(128M Block、2M Block),每个Block都以多副本的形式存储

官方图解:

图解:part-0分了两个Block(1和2),1存在第一、三个DN上,2存在第一、二、四个DN上,part-1也是如此存储

 

HDFS副本摆放机制:

第一个副本放在与原数据同一机架上,第二个放在与第一个不同的相对空闲机的架上,第三个放在与第二个相同机架的不同节点上,第四、五等等(若是有)就随机放在其他机架上

posted @ 2018-02-26 15:58  猴子1  阅读(97)  评论(0编辑  收藏  举报