BZOJ1966: [Ahoi2005]VIRUS 病毒检测 Trie+搜索
Description
科学家们在Samuel星球上的探险仍在继续。非常幸运的,在Samuel星球的南极附近,探险机器人发现了一个巨大的冰湖!机器人在这个冰湖中搜集到了许多RNA片段运回了实验基地。科学家们经过几个昼夜的研究,发现这些RNA片段中有许多是未知的病毒!每个RNA片段都是由A、C、T、G组成的序列。科学家们也总结出了Samuel星球上的“病毒模版片段”。一个模版片段是由A、C、T、G的序列加上通配符 * 和 ? 来表示。其中 * 的意思是可以匹配上0个或任意多个字符,而 ? 的意思是匹配上任意一个字母。如果一个RNA片段能够和“病毒模版片段”相匹配,那么这个RNA片段就是未知的病毒。例如,假设“病毒模版片段”为A*G?C。RNA片段:AGTC,AGTGTC都是未知的病毒,而RNA片段AGTGC则不是病毒。由于,机器人搜集的这些RNA片段中除去病毒的其他部分都具有非常高的研究价值。所以科学家们希望能够分辨出其中哪些RNA片段不是病毒,并将不是病毒的RNA片段运回宇宙空间站继续进行研究。科学家将这项任务交给了小联。现在请你为小联编写程序统计哪些RNA片段不是病毒。
Input
第一行有一个字符串,由A、C、T、G、*、? 组成。表示“病毒模版片段”。“病毒模版片段”的长度不超过1000。第二行有一个整数N(0<N<500),表示机器人搜集到的RNA片段的数目。随后的N行,每一行有一个字符串,由A、C、T、G组成,表示一个RNA片段。每个RNA片段的长度不超过500。注意:“病毒模版片段”和RNA片段的长度都至少为1。
Output
只有一行输出,为整数M,即不是病毒的RNA片段的数目。
Sample Input
3
AGTC
AGTGTC
AGTGC
Sample Output
HINT
输入中的RNA片段AGTGC不是病毒。
Solution
把所有RNA片段扔到trie里面。然后用病毒串在trie内搜索来匹配,用bitset记忆化不然会TLE。
然后要注意bitset大小,不然会MLE
#include <bits/stdc++.h> #define ll long long #define inf 0x3f3f3f3f #define il inline namespace io { #define in(a) a=read() #define out(a) write(a) #define outn(a) out(a),putchar('\n') #define I_int int inline I_int read() { I_int x = 0 , f = 1 ; char c = getchar() ; while( c < '0' || c > '9' ) { if( c == '-' ) f = -1 ; c = getchar() ; } while( c >= '0' && c <= '9' ) { x = x * 10 + c - '0' ; c = getchar() ; } return x * f ; } char F[ 200 ] ; inline void write( I_int x ) { if( x == 0 ) { putchar( '0' ) ; return ; } I_int tmp = x > 0 ? x : -x ; if( x < 0 ) putchar( '-' ) ; int cnt = 0 ; while( tmp > 0 ) { F[ cnt ++ ] = tmp % 10 + '0' ; tmp /= 10 ; } while( cnt > 0 ) putchar( F[ -- cnt ] ) ; } #undef I_int } using namespace io ; #define N 610 int ans = 0 , n , Len , ch[250001][5] , sz , val[250001] ; char a[1010] ; std::bitset<1001> f[250001] ; int idx(char c) { if(c == 'A') return 1; if(c == 'C') return 2; if(c == 'T') return 3; if(c == 'G') return 4; if(c == '?') return 5; if(c == '*') return 6; } void insert(char *s) { int len = strlen(s) , u = 0 ; for(int i = 0 ; i < len ; i ++) { int c = idx(s[i]) ; if(!ch[u][c]) ch[u][c] = ++ sz ; u = ch[u][c] ; } val[u] ++ ; } void dfs(int u , int now) { if(now == Len+1) { ans += val[u] ; val[u] = 0 ; return ; } if(f[u][now]) return ; f[u][now] = 1; int c = idx(a[now]) ; if(c <= 4) { if(ch[u][c]) dfs(ch[u][c] , now + 1) ; } else { if(c == 5) { for(int i = 1; i <= 4; i ++) if(ch[u][i]) dfs(ch[u][i] , now + 1) ; } else { dfs(u , now + 1) ; for(int i = 1 ; i <= 4 ; i ++) if(ch[u][i]) dfs(ch[u][i] , now) , dfs(ch[u][i] , now + 1); } } } int main() { scanf( "%s" , a + 1 ) ; Len = strlen(a + 1) ; n = read() ; for(int i = 1 ; i <= n ; i ++) { char s[1000] ; scanf("%s" , s) ; insert(s) ; } dfs(0 , 1) ; outn(n - ans) ; return 0 ; }