2014年4月21日
摘要: 上篇介绍提到,NameNode主要通过EditLog和FsImage两个文件来维护整个集群的namespace。在NameNode启动时,合并两个文件并更新FsImage,并将EditLog清空,启动后只需要实时更新EditLog文件。如果集群庞大且操作十分密集的话,会使EditLog非常肥大,从... 阅读全文
posted @ 2014-04-21 23:12 risan 阅读(1620) 评论(0) 推荐(0) 编辑
摘要: 1. HDFS最初作为Apache Nutch搜索引擎的基础而生,被设计为可在廉价硬件设备上运行的具有高容错性的分布式文件系统。2. 主要设计目标是大吞吐量而非低延迟性,为此放松了一些POSIX协议的要求。3. HDFS支持超大文件,典型文件通常是GB级的。HDFS的文件是一次写入多次读取模式。4.... 阅读全文
posted @ 2014-04-21 19:04 risan 阅读(284) 评论(0) 推荐(0) 编辑