HDFS简介
摘要:
HDFS的设计:流式数据访问:HDFS的构建思路:一次写入多次读取时最高效的访问模式。HDFS的概念:HDFS的块:默认64M。设计如此之大目的是为了最小化寻址开销。如果设置的足够大,磁盘传输数据的时间将明显大于寻址时间,这样一个由多个块组成的文件时间取决于磁盘传输速率。Namenode和Datanode:HDFS有两类节点,并以管理者-工作者模式运行,即一个Namenode和多个Datanode。Namenode管理文件系统的命名空间,它维护着文件系统树,及整棵树内所有文件和目录,这些信息以命名空间镜像文件和编辑日志文件永久保存在本地磁盘。Namenode也记录每个文件中各个块所在的节点信息 阅读全文