0004.Hadoop的体系结构

Posted on 2020-10-17 12:45  锦喵卫指挥使  阅读(101)  评论(0编辑  收藏  举报


04-01-HDFS之NameNode的职责.mp4

1)是HDFS的主节点、管理员。职责:接收客户端(命令行、Java程序)的请求:创建目录、上传数据、下载数据、删除数据等等
2)管理和维护HDFS的日志和元信息

	* 日志文件(edits文件):记录的是客户端的所有操作,同时体现了HDFS的最新的状态是一个二进制文件
		1)位置:/root/training/hadoop-2.7.3/tmp/dfs/name/current
			edits_inprogress_0000000000000000107 代表:正在操作的日志文件
			
		2)HDFS提供了一个日志查看器(edits viewer),把edits文件转成文本(XML)格式
			命令:hdfs oev -i edits_inprogress_0000000000000000107 -o ~/a.xml
	* 元信息文件(fsimage文件):记录的是数据块的位置信息、数据块的冗余信息
			没有提现HDFS的最新状态,是一个二进制文件
			
			位置:/root/training/hadoop-2.7.3/tmp/dfs/name/current
			HDFS提供了一个元信息查看器(image viewer),把fsimage文件转为文本或者xml都可以
日志文件.png

1602902966798


04-02-HDFS之DataNode

  • 职责:按照数据块保存数据库
    1.x: 64M
    2.x:128M
  • 数据块:表现形式:就是一个文件(blk*******)
    位置:/root/training/hadoop-2.7.3/tmp/dfs/data/current/BP-2054191268-127.0.1.1-1602896540671/current/finalized/subdir0/subdir0

04-03-HDFS之SecondaryNameNode

SecondaryNameNode日志合并的过程.png

1602902966798

职责:进行日志信息的合并

  • 由于edits文件记录了最新的状态信息,并且随着操作越多,edits就会越大
  • 把edits中的最新信息写到fsimage中
  • edits文件就可以清空

补充点知识:检查点checkpoint

  • Spark中的RDD的检查点:容错机制
  • Oracle中的检查点:会以最高优先级唤醒数据库的写进程,将脏数据写入硬盘文件

Copyright © 2024 锦喵卫指挥使
Powered by .NET 8.0 on Kubernetes