暑假周进度总结(4)
本周学习了第三章:分布式文件系统HDFS
通过本章的学习:我知道分布式文件系统HDFS其是由很多廉价机器组成,并且其分为名称结点和数据结点,名称结点存储元数据,而数据结点存储文件的内容,名称结点是主结点,数据结点是从结点。HDFS有很多的优良特性,如廉价兼容的硬件设备(机房中的廉价机器)、流数据读写、大数据集、简单的文件模型、强大的跨平台兼容性,同时也有很多的局限性:不适合低延迟数据访问、无法高效存储大量小文件、不支持多用户写入及任意修改文件。HDFS有两个重要的文件:Fsimage和Editlog,Fsimage包含文件系统所有目录和其他信息,Editlog记录文件进行的一些增删改查的操作,并且这些文件都有很多个备份,分布存储在不同的机器上,所以HDFS就实现了廉价机器的应用,即使某一台机器坏了,其上边的文件在其他的机器上还有很多的备份,同样可以找到此文件。
HDFS的存储原理可以对冗余数据保存,并能容易检查数据错误、保证数据可靠性、加快数据传输速度。还提供数据的存放和获取的方法,并能对数据的错误进行修改和恢复。