2014年4月1日

An Efficient Implementation of Trie Structures (转载)

摘要: http://sbp810050504.blog.51cto.com/2799422/1310596http://blog.csdn.net/zzran/article/details/8462002http://www.360doc.com/content/11/0607/13/28217_122214053.shtmlbenwen.pdfImplement.pdf引言在许多的信息检索应用中,很多地方都需要以前缀匹配的方式来检索输入的字符串。比如:编译器的词法分析、目录检索、拼写检查、中文分词的词库等自然语言处理相关的应用。为了提高检索的效率,我们通常把字符串构建成Trie树的形式。Trie 阅读全文

posted @ 2014-04-01 17:23 agilezing 阅读(241) 评论(0) 推荐(0) 编辑

double-array trie (转载)

摘要: http://blog.csdn.net/zzran/article/details/8462002http://sbp810050504.blog.51cto.com/2799422/1310596http://www.360doc.com/content/11/0607/13/28217_122214053.shtmlbenwen.pdfImplement.pdf自己对树是情有独钟,故在元旦放假的时候,翻译了an efficient implementation of trie structures。作者及来源就不叙述了。英文水平有限,但是尽量还原此文章的灵魂。如果有什么不对的地方,敬请各 阅读全文

posted @ 2014-04-01 17:13 agilezing 阅读(365) 评论(0) 推荐(0) 编辑

摘录

摘要: K代表形成Trie的字符串集合。Trie由结点和连接结点的边(arc)组成。结点由Double-Array的下标来标记,边则是由字符来标记,如果一条边从结点n到结点m被标记成a,那么我们可以定义如下的函数g(n,a)=m。对于集合K中的一个字符串S在Trie中形成的一条路径P,如果路径P中有结点m满足g(n,a)=m ,使得在Trie中检索S时,检索到字符a就已经能够将字符串S与Trie中的其它字符串区别开来,那么结点m称为separate node。Double-Array和reducedtrie的关系如下:(到这里就很容易理解了,reduced trie表示的是一种结构,而Double-A 阅读全文

posted @ 2014-04-01 14:22 agilezing 阅读(153) 评论(0) 推荐(0) 编辑

导航