摘要: 一.崩溃原因搭建的是一个hadoop测试集群,所以将数据备份参数设置为dfs.replication=1,这样如果有一台datanode损坏的话,数据就会失去。但不幸的是,刚好就有一台机器由于负载过高,导致数据操坏。进而后面需要重启整个hadoop集群,重启后启动namenode启动不了。报如下错误:Java代码 FSNamesysteminitializationfailedsaveLeasesfoundpath/tmp/xxx/aaa.txtbutnomatchingentryinnamespace.FSNamesystem initialization failed saveLeases 阅读全文
posted @ 2011-11-10 15:58 John Liang 阅读(2423) 评论(0) 推荐(0) 编辑
摘要: 1.修改conf/core-site.xml,增加Xml代码<property><name>fs.checkpoint.period</name><value>3600</value><description>Thenumberofsecondsbetweentwoperiodiccheckpoints.</description></property><property><name>fs.checkpoint.size</name><value>67 阅读全文
posted @ 2011-11-10 15:41 John Liang 阅读(707) 评论(0) 推荐(0) 编辑
摘要: 一、dits和fsimage 首先要提到两个文件edits和fsimage,下面来说说他们是做什么的。集群中的名称节点(NameNode)会把文件系统的变化以追加保存到日志文件edits中。当名称节点(NameNode)启动时,会从镜像文件 fsimage 中读取HDFS的状态,并且把edits文件中记录的操作应用到fsimage,也就是合并到fsimage中去。合并后更新fsimage的HDFS状态,创建一个新的edits文件来记录文件系统的变化 那么问题来了,只有在名称节点(NameNode)启动的时候才会合并fsimage和edits,那么久而久之edits文件会越来越大,特别是大型繁. 阅读全文
posted @ 2011-11-10 14:37 John Liang 阅读(684) 评论(0) 推荐(0) 编辑
摘要: (1)NameNode的内存中保存了庞大的目录树结构,这个结构用来保存文件目录结构和文件Block之间的映射,这种结构关系会固化在磁盘上,但是对树的改动频繁发生,什么时候将树写入磁盘呢?把每次操作应用到内存中的树上,并把操作记录成日志文件,每次操作不会改变固化在磁盘上的改动发生之前的目录树,适当的时候做一次固化操作并记录时间。(2)NameNode上面的磁盘目录结构:[hadoop@localhost dfs]$ ls -R namename:currentimagein_use.lockname/current:editsfsimagefstimeVERSIONname/image:fsim 阅读全文
posted @ 2011-11-10 14:05 John Liang 阅读(562) 评论(0) 推荐(0) 编辑
摘要: (1)NameNode保存的两种信息:文件与block的映射、block与DataNode的映射。文件和block的映射,固化在磁盘上。而block和DataNode的映射在DataNode启动时上报给NameNode(2)DatanodeProtocol:用于DataNode来调用NameNode上的方法,情景是DataNode向NameNode通信,方法参数传递到NameNode上;ClientProtocol:提供给客户端,用于访问NameNode。它包含了文件角度上的HDFS功能。和GFS一样,HDFS不提供POSIX形式的接口,而是使用了一个私有接口。一般来说,程序员通过org.ap 阅读全文
posted @ 2011-11-10 14:01 John Liang 阅读(418) 评论(0) 推荐(0) 编辑
摘要: 光从字面上来理解,很容易让一些初学者先入为主的认为:SecondaryNameNode(snn)就是NameNode(nn)的热备进程。其 实不是。snn是HDFS架构中的一个组成部分,但是经常由于名字而被人误解它真正的用途,其实它真正的用途,是用来保存namenode中对HDFS metadata的信息的备份,并减少namenode重启的时间。对于hadoop进程中 ,要配置好并正确的使用 snn,还是需要做一些工作的。hadoop的默认配置中让 snn进程默认运行在了 namenode 的那台机器上,但是这样的话,如果这台机器出错,宕机,对恢复HDFS文件系统是很大的灾难,更好的方式是:将 阅读全文
posted @ 2011-11-10 11:46 John Liang 阅读(1307) 评论(0) 推荐(0) 编辑