摘要:
HDFS是以最少的钱买最烂的机器实现最安全的难度很高的分布式文件系统,可以看出HDFS认为机器故障是种常态,所以设计时充分考虑到单个机器故障,单个磁盘故障,单个文件丢失的情况。 HDFS主要分为client,namenode,datanode三大主题,这里的client更像传统的C/S结构中的C,因为必要时client需要维护一系列的状态,验证数据完整性等;namenode在HDFS中是个单点,是整个HDFS的心脏,他管理着HDFS的文件命名空间,管理整棵文件树的添加,修改,删除,这些都是持久化在硬盘之上的,文件里面的内容包含block的元数据;block和datanode的映射则是放在... 阅读全文