DataNode

一：DataNode工作机制

（1）一个数据块在DataNode上以文件形式存储在磁盘上，包括两个文件，一个是数据本身，一个是元数据包括数据块的长度、

　　快数据的校验和（验证数据完整性）以及时间戳

（2）DataNode启动后向NameNode注册，通过后，周期性（1小时）的向NameNode上报所有的块信息

（3）心跳是每3秒一次，心跳返回结果带有NameNode给DataNode的命令如复制块数据到另一台节点。

　　如果超过10分钟没有收到某个节点的心跳，则认为该节点已经不可用。

（4）集群运行中可以安全加入和退出节点。

二：校验数据完整性

三：掉线时限参数设置

四：服役新数据节点（增加新数据节点）

（1）从其他数据节点再克隆一台数据节点

（2）修改ip地址和主机名

（3）删除原来HDFS文件系统留存下来的文件（data和logs）

（4）source一下配置文件

五：退役旧数据节点

　　白名单：添加到白名单的主机节点都可以访问NameNode，不在白名单上的主机节点不可用，在HDFS上也不会显示

　　黑名单：在黑名单上的数据节点不可用，但在HDFS上有显示记录

1：白名单设置步骤：

　　（1）在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts文件

　　（2）将允许访问NameNode的主机名称写在上面

　　（3）在NameNode的hdfs-site.xml配置文件增加dfs.hosts属性

　　　　

　　（4）将配置文件分发到所有节点

　　（5）刷新NameNode

　　　　命令：hdfs dfsadmin -refreshNodes

　　（6）更新ResourceManager节点

　　　　命令：yarn rmadmin -refreshNodes

2：黑名单设置

　　（1）在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts.exclude文件

　　（2）添加要退役的节点的主机名称

　　（3）在NameNode的hdfs.site.xml配置文件中增加dfs.hosts.exclude属性

　　（4）刷新NameNode和ResourceManager

posted @ 2020-03-15 21:21 拔丝小红薯阅读(519) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部