统计单词个数(划分型)
codevs 1040 统计单词个数
2001年NOIP全国联赛提高组
题目等级 : 黄金 Gold
题目描述 Description
给出一个长度不超过200的由小写英文字母组成的字母串(约定;该字串以每行20个字母的方式输入,且保证每行一定为20个)。要求将此字母串分成k份(1<k<=40),且每份中包含的单词个数加起来总数最大(每份中包含的单词可以部分重叠。当选用一个单词之后,其第一个字母不能再用。例如字符串this中可包含this和is,选用this之后就不能包含th)(管理员注:这里的不能再用指的是位置,不是字母本身。比如thisis可以算做包含2个is)。
单词在给出的一个不超过6个单词的字典中。
要求输出最大的个数。
输入描述 Input Description
第一行为一个正整数(0<n<=5)表示有n组测试数据
每组的第一行有二个正整数(p,k)
p表示字串的行数;
k表示分为k个部分。
接下来的p行,每行均有20个字符。
再接下来有一个正整数s,表示字典中单词个数。(1<=s<=6)
接下来的s行,每行均有一个单词。
输出描述 Output Description
每行一个整数,分别对应每组测试数据的相应结果。
样例输入 Sample Input
1
1 3
thisisabookyouareaoh
4
is
a
ok
sab
样例输出 Sample Output
7
目标:前i个字符中划分为j个部分包含的单词数
如果知道i——j包含的单词数,动态规划可推出答案。
若想知道i——j包含的单词数,处理出以每个位置为起点是否有单词、单词长度可推出。
所以:
ans[j][i]表示前j个字符划分为i个部分包含的单词数
预处理:f[i][j] i——j包含的单词数 g[i]=j 以i为起点有长为j的单词
f数组处理:如果i+g[i]-1<=j,那么f[i][j]里包含以i为起点长为j的单词
状态转移:ans[j][i]=max(ans[k][i-1]+f[k+1][j])
#include<cstdio> #include<cstring> #include<iostream> using namespace std; int T,p,k,sum,g[401],f[201][201],ans[201][41]; string s,ss,word[7]; int len_tot,len[7]; void pre() { s.clear(); for(int i=1;i<=6;i++) word[i].clear(); memset(g,0,sizeof(g)); memset(f,0,sizeof(f)); memset(ans,0,sizeof(ans)); } int main() { scanf("%d",&T); while(T--) { pre(); scanf("%d%d",&p,&k); while(p--) { cin>>ss; s+=ss; } len_tot=s.length(); scanf("%d",&sum); for(int i=1;i<=sum;i++) cin>>word[i]; for(int i=1;i<=sum;i++) len[i]=word[i].length(); memset(g,127,sizeof(g)); for(int i=0;i<len_tot;i++) for(int j=1;j<=sum;j++) if(s.substr(i,len[j])==word[j]&&g[i]>len[j]) g[i]=len[j]; for(int i=0;i<len_tot;i++) for(int j=i;j<len_tot;j++) for(int l=i;l<=j;l++) { if(g[l]>400) continue; if(l+g[l]-1<=j) f[i][j]++; } for(int i=0;i<len_tot;i++) ans[i][1]=f[0][i]; for(int i=2;i<=k;i++) for(int j=i;j<len_tot;j++) for(int l=i-1;l<j;l++) ans[j][i]=max(ans[j][i],ans[l][i-1]+f[l+1][j]); printf("%d\n",ans[len_tot-1][k]); } }