codevs1040 统计单词个数(区间dp+划分dp)

题目描述 Description

给出一个长度不超过200的由小写英文字母组成的字母串(约定;该字串以每行20个字母的方式输入，且保证每行一定为20个)。要求将此字母串分成k份(1<k<=40)，且每份中包含的单词个数加起来总数最大(每份中包含的单词可以部分重叠。当选用一个单词之后，其第一个字母不能再用。例如字符串this中可包含this和is，选用this之后就不能包含th)（管理员注：这里的不能再用指的是位置，不是字母本身。比如thisis可以算做包含2个is）。
单词在给出的一个不超过6个单词的字典中。
要求输出最大的个数。

输入描述 Input Description

第一行为一个正整数(0<n<=5)表示有n组测试数据
每组的第一行有二个正整数(p，k)
p表示字串的行数;
k表示分为k个部分。
接下来的p行，每行均有20个字符。
再接下来有一个正整数s，表示字典中单词个数。(1<=s<=6)
接下来的s行，每行均有一个单词。

输出描述 Output Description

每行一个整数，分别对应每组测试数据的相应结果。

样例输入 Sample Input

1
1 3
thisisabookyouareaoh
4
is
a
ok
sab

被这题卡了好久。。。还是不够熟练。

令d[i][j]表示前i个字符划分成j份包含的最大单词数,则最后的答案就是d[p*20][k]

可是d[i][j]怎么求呢?

按照此类dp的思路，一般可以写成

d[i][j] = max { d[k][j-1] + ? }

其中k<i,表示将前k个划分成j-1份取得的最大值。而当中的？就是从k+1到i位置的一个与该dp模型相关的值了。在此处它应该是区间[k+1,i]中的最大单词数。

于是问题又转换成了做区间dp。模型已经出来了，就是f[i][j]表示区间[i,j]的最大单词数

这里需要注意，题目说一个单词用过之后它词首那个位置就不能再用了，因此

f[i][j] = f[i+1][j]

或 f[i+1][j] + 1 //存在一个以第i个字母开头的单词(且结尾不超过j)

最多才6个单词,直接找就好了

#include<iostream>
#include<cassert>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<string>
#include<iterator>
#include<cstdlib>
#include<vector>
#include<stack>
#include<map>
#include<set>
using namespace std;
#define rep(i,f,t) for(int i = (f),_end_=(t); i <= _end_; ++i)
#define rep2(i,f,t) for(int i = (f),_end_=(t); i < _end_; ++i)
#define dep(i,f,t) for(int i = (f),_end_=(t); i >= _end_; --i)
#define dep2(i,f,t) for(int i = (f),_end_=(t); i > _end_; --i)
#define clr(c, x) memset(c, x, sizeof(c) )
typedef long long int64;
const int INF = 0x5f5f5f5f;
const double eps = 1e-8;


//*****************************************************


char ss[10][10];
char c[220];
int a[220][220];<span style="white-space:pre">	</span>//对应上面说的f
int d[220][45];
int n,m,sn;

bool Find(const char *f, const char *t)<span style="white-space:pre">	</span>//查找是否存在以f开头且结尾不超过t的单词
{
    rep(i,1,sn)
    {
        int len = t-f;
        for(int j = 0; j <= len; ++j)
        {
            if(ss[i][j] == 0)return true;
            if(j == len)break;
            if(f[j] != ss[i][j])break;
        }
    }
    return false;
}
void dp1()
{
    rep(i,1,n)if(Find(c+i,c+i+1)) a[i][i] = 1;
    dep(i,n-1,1)
    {
        bool flag = false;
        rep(j,i,n)
        {
            if(flag || (flag=Find(c+i,c+j+1))){
                a[i][j] = a[i+1][j] + 1;
            }
            else
                a[i][j] = a[i+1][j];
        }
    }
}


void dp2()
{
    rep(i,1,n)d[i][0] = a[1][i];
    rep(i,1,n)
    {
        rep(j,1,min(m,i-1))
        {
            rep(k,j,i-1)
            {
                d[i][j] = max(d[k][j-1] + a[k+1][i], d[i][j]);
            }
        }
    }
}
int main()
{
    int T;
    scanf("%d",&T);
    while(T--){
        clr(ss,0);clr(c,0);clr(a,0);clr(d,0);
        scanf("%d%d",&n,&m);
        --m;
        rep(i,0,n-1)scanf(" %s",c+1+i*20);
        n *= 20;
        scanf("%d",&sn);
        rep(i,1,sn)scanf(" %s",ss[i]);
        dp1();
        dp2();
        cout<<d[n][m]<<endl;
    }


    return 0;
}

posted @ 2014-12-01 23:32 DSChan 阅读(209) 评论(0) 收藏举报

刷新页面返回顶部

从零开始ACM

codevs1040 统计单词个数(区间dp+划分dp)

公告