HDFS简介

HDFS的设计:

流式数据访问:HDFS的构建思路:一次写入多次读取时最高效的访问模式。

HDFS的概念:

HDFS的块:默认64M。设计如此之大目的是为了最小化寻址开销。如果设置的足够大,磁盘传输数据的时间将明显大于寻址时间,这样一个由多个块组成的文件时间取决于磁盘传输速率。

Namenode和Datanode:

HDFS有两类节点,并以管理者-工作者模式运行,即一个Namenode和多个Datanode。Namenode管理文件系统的命名空间,它维护着文件系统树,及整棵树内所有文件和目录,这些信息以命名空间镜像文件和编辑日志文件永久保存在本地磁盘。Namenode也记录每个文件中各个块所在的节点信息,但并不永久保存,这些信息在系统重启时由数据节点重建。

 

posted on 2013-10-18 13:20  大 T  阅读(151)  评论(0编辑  收藏  举报