字典树(前缀树/后缀树)
用途
有人说是为了统计字频,可我觉得 HashMap 就可以完成。有人说比 HashMap 占用内存要小,但我感觉小也小不到哪里去。
有人说为了查询字符,还是那句话,HashSet 表示我也可以。
也许在 Hash 没有出来前,它也许在这些领域占有一席之地。目前,从数据结构来看,我认为它的作用也许在以下方面比较突出:
- 也被称为 前缀树,就是剔除相同的前缀操作,这里看不懂很正常,后面慢慢说
- 搜索提示,讲了下面结构你就理解了
结构
这就是字典树,我们沿着最左边走一遭,那就是 JOHNNY。
先来说下之前提到的第一个用途,前缀树。比如有两个字符串, JOHNNY 和 JOHN。可以发现两者拥有前缀,JOHN,这有什么作用呢?数据压缩的时候也许会用到,可以看这题。
820. 单词的压缩编码
接下来,说说第二个功能。比如你在搜索框中输入了 JO,那我根据字典树,我猜测你要找的也许是 JOHNNY 或者 JOE,然后我会给你提示。
定义数据结构
讲一个数据结构,主要就讲,如何去定义一个数据结构,然后涉及相关的操作,这里就是添加(搭建)、删除操作。
因为这也是一个树的结构,只不过这里不一定是二叉树,上面的图有点误导,我们如果要表示英文字符的话,那么从根节点出发,应该有26个字符可供选择。
class NodeTree{
// 用数组编号代替字符,会减小搜索查询时间复杂度
NodeTree[] charNode;
// 记录下面子节点被使用个数,为了删除操作
int count = 0;
NodeTree(){
charNode = new NodeTree[26];
}
}
添加(构建)
添加和构建,本质是一样的,构建是通过一定数目的添加实现的。
// 直接添加字符串
public void addString(String s, NodeTree root){
for(int i = 0; i < s.length(); i++){
char c = s.charAt(i);
if(root.charNode[c-'a']==null)
root.charNode[c-'a'] = new NodeTree();
root = root.charNode[c-'a'];
root.count++;
}
}
// 单个添加字符
public NodeTree addChar(char c, NodeTree root){
if(root.charNode[c-'a']==null)
root.charNode[c-'a'] = new NodeTree();
root.count++;
return root.charNode[c-'a'];
}
为了验证是否添加成功,写一个查找字符的函数
public boolean findString(String s, NodeTree root){
boolean flag = false;
for(int i = 0; i < s.length(); i++){
char c = s.charAt(i);
if(root.charNode[c-'a']==null)
return flag;
root = root.charNode[c-'a'];
}
return !flag;
}
小测试
public class TrimTree {
public static void main(String[] args) {
NodeTree root = new NodeTree();
root.addString("test", root);
System.out.println(root.findString("tes", root));
System.out.println(root.findString("test", root));
System.out.println(root.findString("tests", root));
}
}
// 输出
true
true
false
上面这个测试,向字典树中写入,test,然后对test的前缀,tes进行查询,可以正常查询到。