字典树详解

简述

  字典树又称tire树,其为哈希树的变种,哈希树存的是键值字典树存的是字符。字典树用于统计,排序和保存大量字符,常用于搜索引擎,其本质是用字符串的公共前缀来优化查询。其查询过程就像我们在查新华字典,查询时间为O(len)。

树的样子

  假设我们要存以下字符串:"to","tea","ted","ten","a","i","in","inn",那么树的样子是长这样的:

  

 

  其中蓝色字符代表从根节点走到该字符拼出来的字符串存在,黑色表示只是字符串中间的字符。

树的储存

  字典树是一颗多叉树,不是二叉树,所以一个节点可以有多个后继,若该字典树存的是小写字母,那么最多有26个后继。我们用结构体表示一个节点。

struct node{
    int cnt;
    struct node *next[26];
    node(){
        cnt=0;
        memset(next,0,sizeof(next));
    }
};

  cnt表示一个字典树到此有多少相同前缀的数目。

字符串的插入

  插入的过程非常简单,无非是看前缀是否存在,若存在就共享,否则就创建新的节点。

  例如我们要插入add,而ad已经存在。

  •考虑第一个字符a,已经存在,继续往下走

  •考虑第二个字符d,已经存在,继续往下走

  •考虑第三个字符d,不存在,创建新的节点和边

复制代码
void buildtrie(char *s){
    node *p=root;
    node *tmp=NULL;
    int len=strlen(s);
    for(int i=0;i<len;i++){
        if(p->next[s[i]-'a']==NULL){
            tmp=new node;
            p->next[s[i]-'a']=tmp;
        }
        p=p->next[s[i]-'a'];
        p->cnt++;
    }
}
复制代码

  其中对cnt的操作要会灵活变化,是每个字符都cnt++,还是最后一个字符++,要看题目的要求。

字符串的查找

  查找的过程和插入的过程是类似的,从前缀开始一个一个查找,直到全部字符都查找成功或到某一节点找不到当前字符,就查找失败。返回这个字符串在字典树中作为前缀出现的次数,也就是cnt。

复制代码
int findtrie(char *s){
    node *p=root;
    int len=strlen(s);
    for(int i=0;i<len;i++){
        if(p->next[s[i]-'a']==NULL){
            return 0;
        }     
        p=p->next[s[i]-'a'];
    }    
    return p->cnt;
}
复制代码

内存的释放

  有的时候题目数据量过大,查询完可能要放内存。

void del(node *root){
    for(int i=0;i<26;i++){
        if(root->next[i])
            del(root->next[i]);
    }
    delete(root);
}

 内存的申请

  字典树的内存有动态申请和静态申请两种,前者最慢,因为要一个一个空间开。后者最快,一次性把所有空间开好,但前提是题目给你结点上限了。

模板

动态申请:

复制代码
#include<iostream>
#include<stdio.h>
#include<string.h>
using namespace std;
int t,n;
char str[15];
struct node{
    int cnt;
    struct node *next[26];
    node(){
        cnt=0;
        memset(next,0,sizeof(next));
    }
};
node *root;
void buildtrie(char *s){
    node *p=root;
    node *tmp=NULL;
    int len=strlen(s);
    for(int i=0;i<len;i++){
        if(p->next[s[i]-'a']==NULL){
            tmp=new node;
            p->next[s[i]-'a']=tmp;
        }
        p=p->next[s[i]-'a'];
        p->cnt++;
    }
}
int findtrie(char *s){
    node *p=root;
    int len=strlen(s);
    for(int i=0;i<len;i++){
        if(p->next[s[i]-'a']==NULL){
            return 0;
        }     
        p=p->next[s[i]-'a'];
    }    
    return p->cnt;
}
void del(node *root){
    for(int i=0;i<26;i++){
        if(root->next[i])
            del(root->next[i]);
    }
    delete(root);
}
int main()
{
    root=new node;
    while(cin.getline(str,15)){
        if(strlen(str)==0)
            break;
        buildtrie(str);
    }
    while(cin>>str){
        cout<<findtrie(str)<<'\n';
    }
    return 0;
}
View Code
复制代码

 静态申请:

复制代码
#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
const int maxn=1e4+5;
char str[maxn][15];
int cnt_node;
struct node
{
    int cnt;
    struct node *next[10];
    void init()
    {
        cnt = 0;
        memset(next,0,sizeof(next));
    }
}Heap[maxn];
 
inline node* new_node(){//根据cnt_node一个一个提供结点 
    Heap[cnt_node].init();
    return &Heap[cnt_node++];
}
 
node *root = NULL;
 
void buildtrie(char *s)
{
    node *p = root;
    node *tmp = NULL;
    int i,l = strlen(s);
    for(i = 0; i < l; i++)
    {
        if(p->next[s[i]-'0'] == NULL)
        {
            tmp = new_node();
            p->next[s[i]-'0'] = tmp;
        }
        p = p->next[s[i]-'0'];
        p->cnt++;
    }
}
 
bool findtrie(char *s)
{
    node *p = root;
    int i,l = strlen(s);
    for(i = 0; i < l; i++){
        p = p->next[s[i]-'0'];
    } 
    if(p->cnt != 1)    return true;
    return false;
}
 
int main()
{
    int T;
    scanf("%d",&T);
    while(T--){
        cnt_node = 0;
        root = new_node();
        int n;
        scanf("%d",&n);
        for(int i = 1; i <= n; i++){
            scanf("%s",str[i]);
            buildtrie(str[i]);
        }
        int flag = 1;
        for(int i = 1; i <= n; i++){
            if(findtrie(str[i])){
                flag = 0;
                break;
            }
        }
        if(flag)
            printf("YES\n");
        else
            printf("NO\n");
    }
    return 0;
}
View Code
复制代码

 

posted @   艾尔夏尔-Layton  阅读(576)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示