摘要: 在大数据处理中,用字典树来解决一些有公共前缀或者是自动完成功能的词汇存储时,经常能够用到,而且十分方便,总能在O(n)时间内查找到相应节点。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。 字典树的每个节点有26个孩子节点,节点依照其位置,代表不同的字母,而节点中存储的key信息就是能够到达这个节点的公共前缀数目,即从根节点到此节点的路径上字母连起来构成的公共前缀单词的数目。但如果存储的单词数目庞大,而且有公共前缀的不多,则使用字典树将十分耗费空间,呈指数增长~~ 实现的数据结构及操作如下: 1 #ifndef _STDIO_H... 阅读全文
posted @ 2013-04-05 11:06 XiaoH在博客园 阅读(365) 评论(0) 推荐(0) 编辑