BZOJ1966: [Ahoi2005]VIRUS 病毒检测
BZOJ1966: [Ahoi2005]VIRUS 病毒检测
Description
科学家们在Samuel星球上的探险仍在继续。
非常幸运的,在Samuel星球的南极附近,探险机器人发现了一个巨大的冰湖!
机器人在这个冰湖中搜集到了许多RNA片段运回了实验基地。
科学家们经过几个昼夜的研究,发现这些RNA片段中有许多是未知的病毒!
每个RNA片段都是由A、C、T、G组成的序列。
科学家们也总结出了Samuel星球上的“病毒模版片段”。
一个模版片段是由A、C、T、G的序列加上通配符 * 和 ? 来表示。
其中 * 的意思是可以匹配上0个或任意多个字符,而 ? 的意思是匹配上任意一个字母。
如果一个RNA片段能够和“病毒模版片段”相匹配,那么这个RNA片段就是未知的病毒。
例如,假设“病毒模版片段”为A*G?C。RNA片段:AGTC,AGTGTC都是未知的病毒,而RNA片段AGTGC则不是病毒。
由于,机器人搜集的这些RNA片段中除去病毒的其他部分都具有非常高的研究价值。
所以科学家们希望能够分辨出其中哪些RNA片段不是病毒,并将不是病毒的RNA片段运回宇宙空间站继续进行研究。
科学家将这项任务交给了小联。
现在请你为小联编写程序统计哪些RNA片段不是病毒。
Input
第一行有一个字符串,由A、C、T、G、*、? 组成。表示“病毒模版片段”。
“病毒模版片段”的长度不超过1000。
第二行有一个整数N(0<N<500),表示机器人搜集到的RNA片段的数目。
随后的N行,每一行有一个字符串,由A、C、T、G组成,表示一个RNA片段。
每个RNA片段的长度不超过500。
注意:“病毒模版片段”和RNA片段的长度都至少为1。
Output
只有一行输出,为整数M,即不是病毒的RNA片段的数目。
Sample Input
3
AGTC
AGTGTC
AGTGC
Sample Output
HINT
输入中的RNA片段AGTGC不是病毒。
题解Here!
本来以为是一道$AC$自动机的题。
然后一看数据范围这么小:$N<=500$。
好像连$Trie$都不用建,暴力跑个$O(n^3)dp$似乎就能过了?
然后是真的能过。。。
设$dp[i][j]$表示原串匹配到第$i$个字符,模式串匹配到第$j$个字符时是否可行。
直接暴力匹配就好了。。。
$BUT$!星号的部分要特殊处理:
设一个$f$数组,表示$i$位置的星号最早能匹配到的一个字符。
匹配时,如果按照普通方法匹配不上,特判一下病毒模板串的上一位是不是星号。
如果上一位是星号,且这个星号能匹配到的最早位置在$j$之前,那么说明$j$之前的字符都可以丢给星号,于是判定为匹配成功。
问号直接丢掉不管就好了。
细节好多。。。
还有,$RNA$不是只有$A,C,G,U$吗?哪里来的$T$?
我怕不是学了假的高中生物必修一。。。
出题人怕不是初中保送清华,然后连高中都没上。。。
附代码:
#include<iostream> #include<algorithm> #include<cstdio> #include<cstring> #define MAXN 1010 using namespace std; int n,len,ans=0; int f[MAXN]; char str[MAXN],ch[MAXN]; bool dp[MAXN][MAXN]; inline int read(){ int date=0,w=1;char c=0; while(c<'0'||c>'9'){if(c=='-')w=-1;c=getchar();} while(c>='0'&&c<='9'){date=date*10+c-'0';c=getchar();} return date*w; } inline bool check(char x,char y){ if(x==y||x=='?')return true; return false; } void solve(int l){ memset(f,0x3f,sizeof(f)); memset(dp,false,sizeof(dp)); dp[0][0]=true; for(int i=1;i<=len;i++){ if(str[i]=='*'){ if(i==1)dp[1][0]=true; for(int j=1;j<=l;j++) if(dp[i-1][j]||dp[i][j-1]){ dp[i][j]=true; f[i]=min(f[i],j); } } else{ for(int j=1;j<=l;j++){ if(!check(str[i],ch[j]))continue; if(dp[i-1][j-1])dp[i][j]=true; else if(i>1&&str[i-1]=='*'&&f[i-1]<j)dp[i][j]=true; } } } if(dp[len][l])ans++; } void work(){ for(int i=1;i<=n;i++){ scanf("%s",ch+2); ch[1]='#'; int l=strlen(ch+1); ch[++l]='#'; solve(l); } printf("%d\n",n-ans); } void init(){ scanf("%s",str+2); n=read(); str[1]='#'; len=strlen(str+1); str[++len]='#'; } int main(){ init(); work(); return 0; }