2019 年 7月 14 日随笔档案 - Coolc

2019年7月14日

摘要： Hadoop 2.0产生背景 Hadoop 1.0中HDFS和MapReduce在高可用、扩展性等方面存在问题 HDFS存在的问题(2个) NameNode单点故障，难以应用于在线场景 HA NameNode压力过大，且内存受限，影扩展性 F MapReduce存在的问题响系统 JobTracker 阅读全文

posted @ 2019-07-14 12:45 Coolc 阅读(835) 评论(0) 推荐(0) 编辑

HDFS存储与架构

摘要： HDFS存储模型以字节形式存储文件线性切割成块（Block）:偏移量 offset （byte） Block分散存储在集群节点中单一文件Block大小一致，文件与文件可以不一致 Block可以设置副本数，副本无序分散在不同节点中副本数不要超过节点数量文件上传可以设置Block大小和副本数（阅读全文

posted @ 2019-07-14 12:29 Coolc 阅读(1191) 评论(0) 推荐(0) 编辑

HDFS读写流程

摘要： HDFS写流程 Client 切分文件Block 按Block线性和NN获取DN列表（副本数）验证DN列表后以更小的单位流式传输数据各节点，两两通信确定可用 Block传输结束后 DN向NN汇报Block信息 DN向Client汇报完成 Client向NN汇报完成获取下一个Block存放的DN 阅读全文

posted @ 2019-07-14 12:26 Coolc 阅读(209) 评论(0) 推荐(0) 编辑

cook

公告