[bzoj1966][Ahoi2005][VIRUS 病毒检测] (字符串dp)
Description
科学家们在Samuel星球上的探险仍在继续。非常幸运的,在Samuel星球的南极附近,探险机器人发现了一个巨大的冰湖!机器人在这个冰湖中搜集到了许多RNA片段运回了实验基地。科学家们经过几个昼夜的研究,发现这些RNA片段中有许多是未知的病毒!每个RNA片段都是由A、C、T、G组成的序列。科学家们也总结出了Samuel星球上的“病毒模版片段”。一个模版片段是由A、C、T、G的序列加上通配符 * 和 ? 来表示。其中 * 的意思是可以匹配上0个或任意多个字符,而 ? 的意思是匹配上任意一个字母。如果一个RNA片段能够和“病毒模版片段”相匹配,那么这个RNA片段就是未知的病毒。例如,假设“病毒模版片段”为A*G?C。RNA片段:AGTC,AGTGTC都是未知的病毒,而RNA片段AGTGC则不是病毒。由于,机器人搜集的这些RNA片段中除去病毒的其他部分都具有非常高的研究价值。所以科学家们希望能够分辨出其中哪些RNA片段不是病毒,并将不是病毒的RNA片段运回宇宙空间站继续进行研究。科学家将这项任务交给了小联。现在请你为小联编写程序统计哪些RNA片段不是病毒。
Input
第一行有一个字符串,由A、C、T、G、*、? 组成。表示“病毒模版片段”。“病毒模版片段”的长度不超过1000。第二行有一个整数N(0<N<500),表示机器人搜集到的RNA片段的数目。随后的N行,每一行有一个字符串,由A、C、T、G组成,表示一个RNA片段。每个RNA片段的长度不超过500。注意:“病毒模版片段”和RNA片段的长度都至少为1。
Output
只有一行输出,为整数M,即不是病毒的RNA片段的数目。
Sample Input
A*G?C 3 AGTC AGTGTC AGTGC
Sample Output
1
HINT
输入中的RNA片段AGTGC不是病毒。
Solution
设f[i][j]为模式串第i位与匹配串第j位是否匹配,c[i]记录模式串第i位为'*'时匹配的最近位置,辅助转移
#include <stdio.h> #include <string.h> #define MaxL 501 #define MaxBuf 1<<22 #define RG register #define inline __inline__ __attribute__((always_inline)) #define dmin(a,b) ((a)<(b)?(a):(b)) char B[MaxBuf],*p=B; inline void Rin(RG int &x){ x=0; while(*p<'0'||*p>'9')p++; while(*p>='0'&&*p<='9') x=(x<<1)+(x<<3)+*p++-'0'; } inline bool isstr(RG char x){ return (x>='A'&&x<='Z')||x=='?'||x=='*'; } inline void getch(char *C,RG int &x){ *C='0'; x=0; while(!isstr(*p))p++; while(isstr(*p))*++C=*p++,x++; ++C='\0'; } bool f[MaxL][MaxL]; char ch[MaxL],chh[MaxL]; int len,lenn,T,ans(0),c[MaxL]; inline bool matched(RG char x,RG char y){ return (x==y)||(x=='?'); } inline void solve(){ memset(c,0x3f,sizeof c); memset(f,false,sizeof f); f[0][0]=true; for(RG int i=1;i<=len;i++){ if(ch[i]!='*') for(RG int j=1;j<=lenn;j++){ if(matched(ch[i],chh[j])) if(f[i-1][j-1]||(ch[i-1]=='*'&&c[i-1]<j))f[i][j]=true; } else{ if(i==1)f[1][0]=true; for(RG int j=1;j<=lenn;j++){ f[i][j]=f[i-1][j]||f[i][j-1]; if(f[i][j])c[i]=dmin(c[i],j); } } } if(!f[len][lenn]) ++ans; } #define FO(x) {freopen(#x".in","r",stdin);} int main(){ // FO(bzoj1966); fread(p,1,MaxBuf,stdin); getch(ch,len); Rin(T); while(T--){ getch(chh,lenn); solve(); } printf("%d\n",ans); return 0; }