Uvalive 3942 - Remember the Word(字典树+DP)
题目链接 https://cn.vjudge.net/problem/UVALive-3942
【题意】
给出一个由S个不同单词组成的字典和一个长字符串,把这个长字符串分解成若干个单词的连接(单词可重复使用),有多少种方法?比如有4个单词a,b,cd,ab那么abcd有两种分法a+b+cd以及ab+cd.
【输入格式】
多组数据,每组数据的第一行为长度不超过300000的长字符串,第二行是单词的个数S(1<=S<=4000),以下S行每行一个长度不超过100的单词
【输出格式】
对于每组数据,输出方案数对20171027的余数
【思路】
开始还是没思路,看了大白的讲解才写出来的,设dp(i)表示原字符串的子串[i,len-1]的划分方案数,那么dp(i)=sum{dp(i+len(x)) | x是某个单词,同时x为[i,len-1]的前缀 },边界是dp(len)=1,但是这样做要求枚举所有的4000个单词,同时还要判断是否为前缀,很可能超时。如果我们换一种思路,用所有的单词构造一个Trie,就可以避免枚举所有单词的过程了,因为可以直接从Trie树的根结点开始往下找,找到一个单词就进行相应的状态转移,因为单词的长度不超过100,所以最多找100次就能完成该次计算,下面的代码用的是记忆化搜素求解
#include<bits/stdc++.h>
using namespace std;
const int mod=20071027;
const int maxn=400050;
char p[maxn],s[105];
int trie[maxn][26],tot;
int deep[maxn];
bool isword[maxn];
int dp[maxn];
int num,len;
void init(){
len=strlen(p);
tot=0;
memset(trie,0,sizeof(trie));
memset(isword,0,sizeof(isword));
memset(deep,0,sizeof(deep));
memset(dp,-1,sizeof(dp));
}
int dfs(int i){
if(i==len) return 1;
if(dp[i]!=-1) return dp[i];
int node=0,ans=0;
for(int j=i;j<len;++j){
int id=p[j]-'a';
node=trie[node][id];
if(isword[node]) ans=(ans+dfs(i+deep[node]))%mod;
if(!node) break;
}
return dp[i]=ans;
}
void insert(){
int node=0;
for(int i=0;s[i];++i){
int id=s[i]-'a';
if(!trie[node][id]) {
trie[node][id]=++tot;
deep[trie[node][id]]=deep[node]+1;
}
node=trie[node][id];
}
isword[node]=true;
}
int main(){
int kase=0;
while(scanf("%s",p)==1){
init();
scanf("%d",&num);
for(int i=0;i<num;++i){
scanf("%s",s);
insert();
}
int ans=dfs(0);
printf("Case %d: %d\n",++kase,ans);
}
return 0;
}