NameNode和DateNode

NameNode是什么?

Namenode是一个通常在HDFS实例中的单独机器上运行的软件。它负责管理文件系统名称空间和控制外部客户机的访问。Namenode决定是否将文件映射到DataNode上的复制块上。对于最常见的3个复制块,第一个复制块存储在同一机架的不同节点上,最后一个复制块存储在不同机架的某个节点上。Name本身不可避免地具有SPOF(Single Point Of Failure)单节点失效风险,准备模式并不能解决这个问题,通过Hadoop Non-stop namenode才能实现100% uptime可用时间。

DataNode如何理解?

Datenode也是一个通常在HDFS实例中的单独机器上运行的软件。Hadoop及群中包含一个NameNode和大量的DateNode。Datenode通常以机架的形式组织,机架通过一个交换机将所有系统连接起来。Hadoop的一个假设是:机架内部节点之间的传输速度快于机架间节点的传输速度。

Datenode响应来自HDFS客户机的读写请求。它们还响应来自Namenode的创建、删除和复制块的命令。NameNode依赖来自每个Data的定期心跳(heartbeat)消息。每条消息都包含一个块的报告,NameNode可以根据这个报告验证块映射和其他文件系统元数据。如果Datenode不能发送心跳消息,NameNode将采取修复措施,重新复制在该节点上丢失的块。

 

posted @ 2020-02-21 11:39  贾江浦  阅读(624)  评论(0编辑  收藏  举报