HihoCoder-Trie树
首先关于Trie树的知识在另一篇文章中有介绍
题目描述:
小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。
这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?”
身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字符串是不是这个单词的前缀不就是了?”
小Hi笑道:“你啊,还是太年轻了!~假设这本词典里有10万个单词,我询问你一万次,你得要算到哪年哪月去?”
小Ho低头算了一算,看着那一堆堆的0,顿时感觉自己这辈子都要花在上面了...
小Hi看着小Ho的囧样,也是继续笑道:“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”
小Ho想了想,说道:“知道~它是一种基础的数据结构,就像这里说的一样!”
小Hi满意的点了点头,说道:“那你知道我怎么样用一棵树来表示整个词典么?”
小Ho摇摇头表示自己不清楚。
提示一:Trie树的建立
“你看,我们现在得到了这样一棵树,那么你看,如果我给你一个字符串ap,你要怎么找到所有以ap开头的单词呢?”小Hi又开始考验小Ho。
“唔...一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。
“笨!这棵树难道就白构建了!”小Hi教训完小Ho,继续道:“看好了!”
提示二:如何使用Trie树
提示三:在建立Trie树时同时进行统计!
“那么现在!赶紧去用代码实现吧!”小Hi如是说道
题目输入:
输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,表示小Hi询问的次数,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成,表示小Hi的一个询问。
-
在20%的数据中n, m<=10,词典的字母表大小<=2.
-
在60%的数据中n, m<=1000,词典的字母表大小<=5.
-
在100%的数据中n, m<=100000,词典的字母表大小<=26.
本题按通过的数据量排名哦~
题目输出:
对于小Hi的每一个询问,输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。
样例输入
5
babaab
babbbaaaa
abba
aaaaabaa
babaababb
5
babb
baabaaa
bab
bb
bbabbaab
样例输出
1 0 3 0 0
C++实现代码
#include<iostream>
#include<string.h>
using namespace std;
struct TrieNode{
int num;
TrieNode *child[26];//下个字符的26个字母可能性
TrieNode()
{
num=0;
memset(child,NULL,sizeof(child));
}
};
TrieNode* root;
int temp;
//将字符串word添加到字典树中
void insert(string word)
{
if(word.empty()) return;
TrieNode* p=root;
for(int i=0;i<word.size();++i)
{
temp=word[i]-'a';
if(p->child[temp]==NULL)
{
p->child[temp]=new TrieNode;//若节点不存在,则建立一个新节点
}
p=p->child[temp];
p->num++;
}
}
//返回所有以字符串pre为前缀的单词数量
int prefixNumber(string pre)
{
if(pre.empty()) return 0;
TrieNode* p=root;
for(int i=0;i<pre.length();++i)
{
temp=pre[i]-'a';
if(p->child[temp]==NULL)
return 0;
p=p->child[temp];
}
return p->num;
}
int main()
{
int n,m;
string words,pre;
root=new TrieNode;
while(cin>>n)
{
while(n--)//数据输入
{
cin>>words;
insert(words);
}
cin>>m;//查询数据
while(m--)
{
cin>>pre;
int res=prefixNumber(pre);
cout<<res<<endl;
}
}
return 0;
}
字典树的典型应用:
1.统计一组字符串中某前缀出现的次数(直接用上面的代码就行)。
2.判断一组字符串中是否有一个字符串是另一个字符串的前缀。
分析:我们只要在结点中添加一个nEndFlag成员变量即可。若nEndFlag == 1,说明该结点字符是某一字符串的结尾(假设为A),若在插入B字符串的过程中经过这一结点,则说明A是B的 前缀;还有一种情况,当要插入最后一个字符c时,却发现p->next[c-'a']为真,则说明该字符串是一个前缀字符串,eg:先插入abcde,再插入abc这种情况。
- 串排序:给定N个互不相同的仅由一个单词构成的英文名,让你将他们按字典序从小到大输出
用字典树进行排序,采用数组的方式创建字典树,这棵树的每个结点的所有儿子很显然地按照其字母大小排序。对这棵树进行先序遍历即可。