[bzoj1966][Ahoi2005][VIRUS 病毒检测] (字符串dp)

Description

科学家们在Samuel星球上的探险仍在继续。非常幸运的,在Samuel星球的南极附近,探险机器人发现了一个巨大的冰湖!机器人在这个冰湖中搜集到了许多RNA片段运回了实验基地。科学家们经过几个昼夜的研究,发现这些RNA片段中有许多是未知的病毒!每个RNA片段都是由A、C、T、G组成的序列。科学家们也总结出了Samuel星球上的“病毒模版片段”。一个模版片段是由A、C、T、G的序列加上通配符 * 和 ? 来表示。其中 * 的意思是可以匹配上0个或任意多个字符,而 ? 的意思是匹配上任意一个字母。如果一个RNA片段能够和“病毒模版片段”相匹配,那么这个RNA片段就是未知的病毒。例如,假设“病毒模版片段”为A*G?C。RNA片段:AGTC,AGTGTC都是未知的病毒,而RNA片段AGTGC则不是病毒。由于,机器人搜集的这些RNA片段中除去病毒的其他部分都具有非常高的研究价值。所以科学家们希望能够分辨出其中哪些RNA片段不是病毒,并将不是病毒的RNA片段运回宇宙空间站继续进行研究。科学家将这项任务交给了小联。现在请你为小联编写程序统计哪些RNA片段不是病毒。

Input

第一行有一个字符串,由A、C、T、G、*、? 组成。表示“病毒模版片段”。“病毒模版片段”的长度不超过1000。第二行有一个整数N(0<N<500),表示机器人搜集到的RNA片段的数目。随后的N行,每一行有一个字符串,由A、C、T、G组成,表示一个RNA片段。每个RNA片段的长度不超过500。注意:“病毒模版片段”和RNA片段的长度都至少为1。

Output

只有一行输出,为整数M,即不是病毒的RNA片段的数目。

Sample Input

A*G?C
3
AGTC
AGTGTC
AGTGC

Sample Output

1

HINT

输入中的RNA片段AGTGC不是病毒。

Solution

设f[i][j]为模式串第i位与匹配串第j位是否匹配,c[i]记录模式串第i位为'*'时匹配的最近位置,辅助转移

#include <stdio.h>
#include <string.h>
#define MaxL 501
#define MaxBuf 1<<22
#define RG register
#define inline __inline__ __attribute__((always_inline))
#define dmin(a,b) ((a)<(b)?(a):(b))
char B[MaxBuf],*p=B;
inline void Rin(RG int &x){
    x=0;
    while(*p<'0'||*p>'9')p++;
    while(*p>='0'&&*p<='9')
        x=(x<<1)+(x<<3)+*p++-'0';
}
inline bool isstr(RG char x){
    return (x>='A'&&x<='Z')||x=='?'||x=='*';
}
inline void getch(char *C,RG int &x){
    *C='0'; x=0;
    while(!isstr(*p))p++;
    while(isstr(*p))*++C=*p++,x++;
    ++C='\0';
}
bool f[MaxL][MaxL];
char ch[MaxL],chh[MaxL];
int len,lenn,T,ans(0),c[MaxL];
inline bool matched(RG char x,RG char y){
    return (x==y)||(x=='?');
}
inline void solve(){
    memset(c,0x3f,sizeof c);
    memset(f,false,sizeof f);
    f[0][0]=true;
    for(RG int i=1;i<=len;i++){
        if(ch[i]!='*')
            for(RG int j=1;j<=lenn;j++){
                if(matched(ch[i],chh[j]))
                    if(f[i-1][j-1]||(ch[i-1]=='*'&&c[i-1]<j))f[i][j]=true;
            }
        else{
            if(i==1)f[1][0]=true;
            for(RG int j=1;j<=lenn;j++){
                f[i][j]=f[i-1][j]||f[i][j-1];
                if(f[i][j])c[i]=dmin(c[i],j);
            }
        }
    }
    if(!f[len][lenn])
        ++ans;
}
#define FO(x) {freopen(#x".in","r",stdin);}
int main(){
//    FO(bzoj1966);
    fread(p,1,MaxBuf,stdin);
    getch(ch,len);
    Rin(T);
    while(T--){
        getch(chh,lenn);
        solve();
    }
    printf("%d\n",ans);
    return 0;
}

 

posted @ 2017-01-25 20:12  keshuqi  阅读(432)  评论(0编辑  收藏  举报