浏览器标题切换
浏览器标题切换end
把博客园图标替换成自己的图标
把博客园图标替换成自己的图标end

BZOJ1966: [Ahoi2005]VIRUS 病毒检测 Trie+搜索

Description

科学家们在Samuel星球上的探险仍在继续。非常幸运的,在Samuel星球的南极附近,探险机器人发现了一个巨大的冰湖!机器人在这个冰湖中搜集到了许多RNA片段运回了实验基地。科学家们经过几个昼夜的研究,发现这些RNA片段中有许多是未知的病毒!每个RNA片段都是由A、C、T、G组成的序列。科学家们也总结出了Samuel星球上的“病毒模版片段”。一个模版片段是由A、C、T、G的序列加上通配符 * 和 ? 来表示。其中 * 的意思是可以匹配上0个或任意多个字符,而 ? 的意思是匹配上任意一个字母。如果一个RNA片段能够和“病毒模版片段”相匹配,那么这个RNA片段就是未知的病毒。例如,假设“病毒模版片段”为A*G?C。RNA片段:AGTC,AGTGTC都是未知的病毒,而RNA片段AGTGC则不是病毒。由于,机器人搜集的这些RNA片段中除去病毒的其他部分都具有非常高的研究价值。所以科学家们希望能够分辨出其中哪些RNA片段不是病毒,并将不是病毒的RNA片段运回宇宙空间站继续进行研究。科学家将这项任务交给了小联。现在请你为小联编写程序统计哪些RNA片段不是病毒。

Input

第一行有一个字符串,由A、C、T、G、*、? 组成。表示“病毒模版片段”。“病毒模版片段”的长度不超过1000。第二行有一个整数N(0<N<500),表示机器人搜集到的RNA片段的数目。随后的N行,每一行有一个字符串,由A、C、T、G组成,表示一个RNA片段。每个RNA片段的长度不超过500。注意:“病毒模版片段”和RNA片段的长度都至少为1。

Output

只有一行输出,为整数M,即不是病毒的RNA片段的数目。

Sample Input

A*G?C
3
AGTC
AGTGTC
AGTGC

Sample Output

1

HINT

输入中的RNA片段AGTGC不是病毒。

Solution

把所有RNA片段扔到trie里面。然后用病毒串在trie内搜索来匹配,用bitset记忆化不然会TLE。

然后要注意bitset大小,不然会MLE

#include <bits/stdc++.h>

#define ll long long
#define inf 0x3f3f3f3f
#define il inline

namespace io {

    #define in(a) a=read()
    #define out(a) write(a)
    #define outn(a) out(a),putchar('\n')

    #define I_int int
    inline I_int read() {
        I_int x = 0 , f = 1 ; char c = getchar() ;
        while( c < '0' || c > '9' ) { if( c == '-' ) f = -1 ; c = getchar() ; }
        while( c >= '0' && c <= '9' ) { x = x * 10 + c - '0' ; c = getchar() ; }
        return x * f ;
    }
    char F[ 200 ] ;
    inline void write( I_int x ) {
        if( x == 0 ) { putchar( '0' ) ; return ; }
        I_int tmp = x > 0 ? x : -x ;
        if( x < 0 ) putchar( '-' ) ;
        int cnt = 0 ;
        while( tmp > 0 ) {
            F[ cnt ++ ] = tmp % 10 + '0' ;
            tmp /= 10 ;
        }
        while( cnt > 0 ) putchar( F[ -- cnt ] ) ;
    }
    #undef I_int

}
using namespace io ;

#define N 610

int ans = 0 , n , Len , ch[250001][5] , sz , val[250001] ;
char a[1010] ;
std::bitset<1001> f[250001] ;

int idx(char c) {
    if(c == 'A') return 1;
    if(c == 'C') return 2;
    if(c == 'T') return 3;
    if(c == 'G') return 4;
    if(c == '?') return 5;
    if(c == '*') return 6;
}

void insert(char *s) {
    int len = strlen(s) , u = 0 ;
    for(int i = 0 ; i < len ; i ++) {
        int c = idx(s[i]) ;
        if(!ch[u][c]) ch[u][c] = ++ sz ;
        u = ch[u][c] ;
    }
    val[u] ++ ;
}

void dfs(int u , int now) {
    if(now == Len+1) {
        ans += val[u] ;
        val[u] = 0 ;
        return ;
    }
    if(f[u][now]) return ;
    f[u][now] = 1;
    int c = idx(a[now]) ;
    if(c <= 4) {
        if(ch[u][c]) dfs(ch[u][c] , now + 1) ;
    } else {
        if(c == 5) {
            for(int i = 1; i <= 4; i ++) 
                if(ch[u][i]) dfs(ch[u][i] , now + 1) ;
        } else {
            dfs(u , now + 1) ;
            for(int i = 1 ; i <= 4 ; i ++)
                if(ch[u][i]) dfs(ch[u][i] , now) , dfs(ch[u][i] , now + 1);
        }
    }
}

int main() {
    scanf( "%s" , a + 1 ) ;
    Len = strlen(a + 1) ;
     n = read() ; 
    for(int i = 1 ; i <= n ; i ++) {
        char s[1000] ;
        scanf("%s" , s) ;
        insert(s) ; 
    }
    dfs(0 , 1) ;
    outn(n - ans) ;
    return 0 ;
}

 

posted @ 2018-12-02 18:15  henry_y  阅读(161)  评论(0编辑  收藏  举报