2013年12月4日

KMP算法

摘要: KMP算法(3个人的名字的头字母,Knuth与Pratt和Morris),主要就是应用有限自动机的原理。 KMP算法的核心思想是利用已经得到的部分匹配信息来进行后面的匹配过程。 在S=”abcabcabdabba”中查找T=”abcabd”,如果使用KMP匹配算法,当第一次搜索到S[5]和T[5]不等后,S下标不是回溯到1,T下标也不是回溯到开始,而是根据T中T[5]==’d’的模式函数值(next[5]=2),直接比较S[5]和T[2]是否相等(换到状态2中去),因为相等,S和T的下标同时增加。 一.模式值next[n]的计算,也就是状态转移 一定要想成状态转移,eg: st... 阅读全文

posted @ 2013-12-04 20:57 依蓝jslee 阅读(252) 评论(0) 推荐(0) 编辑

HDFS(转)

摘要: 一、HDFS架构 Rack(机架)指的是一些计算机节点构成的集合,他们也许在一个网络中。数据存储细节NameNode 目录结构Namenode的目录结构: ${dfs.name.dir}/current /VERSION/edits/fsimage/fstime dfs.name.dir是hdfs-site.xml里配置的若干个目录组成的列表。NameNode Namenode上保存着HDFS的名字空间。对于任何对文件系统元数据产生修改的操作,Namenode都会使用一种称为EditLog的事务日志记录下来。例如,在HDFS中创建一个文件,Namenode就会在Editlog中插入一条记录.. 阅读全文

posted @ 2013-12-04 14:10 依蓝jslee 阅读(715) 评论(0) 推荐(0) 编辑

导航