fsimage 和 edits

转载地址：https://www.aboutyun.com/blog-40148-2944.html

怎么理解这两个文件？

这两个文件本质上是一样，都是备份。

先从盘古开天地讲起，（给你设计你会怎么设计）
一开始，光有namenode进程，还并没有这两个文件的概念，当外部客户端有操作了，namenode进程把客户端的操作生成元数据，在进程中记录下来，也就是可能在内存维护一个列表数据结构之类的什么吧。

就这样吧，能用了

问题是这样直接记录在内存中，一掉电这些信息就丢了（服务器不重启就还能好好的运行工作下去），重启，进程起来，进程内部数据结构中没有任何元数据记录，进程可能会认为hdfs是空的，

你想到了用一个文件记录下来。。。可行，先姑且命名为edits，每次操作，进程还是老样子，生成元数据信息放在进程的数据结构中，也就是内存，同时在edits文件中记录下每一步操作的步骤，为什么不直接把元数据顺便保存到edits里面呢？也许是因为记录步骤成本更低，可能记录元数据还比较复杂，总之把步骤记录下来可能比较划算，就在文件中记录步骤，至少现在的机制看来是这样的。

重启，进程中的数据结构刚开始是空的是肯定的，再把之前记录到edits中的步骤，重演一遍，相当于客户端重新操作一遍，把每一步生成的元数据再次存到自己的数据结构中，也就恢复了HDFS集群的datanode分布信息。继续处理客户端的操作，没问题。

客户端新来的操作，操作步骤往这个edits里追加。
每来一个操作，namenode进程一边把操作转换生成元数据保存在自己的内存数据结构中，一遍把步骤写到edits，备份操作步骤，还是前面的以为，为什么不把元数据直接写到edits？

重启的时候，namenode进程先要做的，就是读取edits文件中的所有步骤，重新操作这些步骤，在内存中重现hdfs集群的datanode分布信息，内存的数据结构就又有元数据信息了，这样周而复始。

这样周而复始下去，操作越多edits中的步骤越多。每次进程重启，记录下来的操作步骤都重做一遍的，累死。。。

上面的机制，按理说别操作太多，可以交差了，

幻想客户端应该不会操作太多吧。。。屁，还叫大数据干嘛

稍微。。。改改

这样改，hdfs创建之初就自带生成两个文件放那，hdfs格式化肯定都是空的，我们改进的理念还是保证edits记录功能，稍微有点进化。
两个文件一个叫fsimage,一个叫做eidts
fsimage里面保存生成好元数据的可能是某种神奇的镜像文件，具体是什么我也不清楚，反正就是进程读取的时候速度非常快，结束了进程一个步骤一个步骤的去重现演算所有步骤的体力活。取而代之的是一次性加载fsimage进内存，快速恢复所有元数据。
看过程推演：
安装hdfs,格式化，这时啥也没有，两个文件都是空的，客户端进行操作，namenode进程把每一步操作转的元数据，存到进程的数据结构中，把所有步骤记录到edits。运行下去。。。内存里记录了很多元数据，edits里也记录了这些元数据对应的所有步骤。
duang，重启，内存的数据都空了，进程一起来第一件事就是重演edits里的步骤，相当于客户端重新操作一遍（那这样的话，重演一遍的话，我们知道hdfs不是一次存储多次读取吗？不让第二次写的吗？【hdfs 是块存储，也就是每次读取一个块，存储也是一样的，所以你可以理解为可以随机读写文件块，但是对文件不支持随机读写，因为一个文件块中有很多文件】哦。。。这时正对namenode来说的，也就是客户端写的东西，namenode里有了，namenode拒绝，现在namenode重启啥数据也米有，相当于hdfs服务器是空的，这样就没问题），进程重启之初，namenode进程会把edits中记录的步骤还原到fsimage里，然后把这个文件瞬间加载到进程内存中，这样进程内存中就有了元数据了，这段时间，相当于把edits和fsimage合并，合并到fsimage。
这第一步结束之后，namenode进程的内存状态恢复到重启前的状态了，可以继续接待客户端新的操作了，继续做着把操作步骤记录到eidts，把步骤的元数据转换到自己的进程内存中的工作。
duang，重启，内存又空了，进程一起来，第一件事就是合并这两个文件，重演edits里的步骤，得到元数据追加到fsimage，加载合并后的fsimage到内存，恢复到重启前的内存状态。继续做着接待客户端的工作，把操作步骤记录到eidts，把步骤的元数据转换到自己的进程内存中的工作。周而复始。

等到重启，加载旧的前面n..n次前的元数据信息，也就只需要加载一次fsimage，估计这个镜像文件加载速度不慢，重演的步骤也就最近一次重启前的步骤，相对之前要重现从安装hdfs系统以来所有的操作步骤现在已经少了不少，因为以前的步骤都在之前就合并成fsimage合并掉了。

这样，这个机制也能凑活运行下去，

再稍微优化一下，

再加一个进程，叫secondary namenode，开辟另外的一台服务器，上面运行一个secondaryNamenode进程，相当于一个助手的角色，
定期的从namenode这台服务器复制fsimage和edits文件（这里有个细节就是，deits复制走），然后做掉namenode重启的的时候该做的事情，具体这位助手做了哪些事情：
就是加载fsimage到进程内存，然后重演edits记录的步骤，产生元数据，这个过程就是namenode服务进程重启后要做的第一件事。这个助手之后再把所有元数据导出来，生成相同格式的fsimage文件，重命名为fsimage.chpt，再悄悄放回到主人服务器上并把名字改成fsimage，
主人掉电重启的时候就会直接加载这个文件，快速读进内存，不用重演好多步骤。
助手把edits文件取走了之后，不就没这个文件了吗，这时主人要记录新的操作步骤，要往哪记呢？当然，助手会创建一个新的edits，主人根本不知道edits被替换过,自己写入的是个新的edits。就像你在饭店吃饭，服务员定期给你换了骨盘一样的感觉。
这样，极限的理想情况会变成什么样？就是助手不停的合并主人的edits到fsimage，以至于主人的edits里面的步骤是空的，下次主人重启，根本不要重演步骤，速度是不是就爽了。

fsimage是被复制走的应该，等secondary返回新的fsimage在把旧的覆盖，因为如果是移走，那这时候重启就没fsimage加载了
edits说的移走的，创建一个新的edits给primaryNamenode使用，但如果这时候重启，前面操作的步骤不也丢了？

posted @ 2020-07-03 11:32 Loading~ 阅读(452) 评论(0) 编辑收藏举报

刷新页面返回顶部

No pain No gain

本博客用于知识的总结与梳理

fsimage 和 edits

公告