字符串匹配算法之Multiple Shift-And algorithm

http://hi.baidu.com/rodimus/blog/item/c5455c389b168323b8998f18.html

前面讨论的都是在源串里寻找单一的串。如果要同时寻找同个串的话,可以每个串都用一次单串的算法。这是可行的,只是效率上比较低。可以对前面的单串算法作适当的扩展,使它直接适应多串的情况。

对于Shift-And算法,可以直接把几个串拼成一个串,当然前题是这些串的长度和小于等于计算机的字长。然后对初始状态作一下修改,对结束时判断是否成功作一下修改。就可以了。

代码如下:(未测试)

Multiple_Shift_And(char * s, int n, char ** p, int k)
{
unsigned int b[128];
memset(b, 0, sizeof(b));

int i;
int tot = 0;

unsigned int di = 0, fi = 0;

for (i=0; i<k; i++)
{
   int m = strlen(p[i]);
   di |= 1<<tot;
   fi |= 1<<(tot+m-1);
   for (j=0; j<m; j++)
   {
    B[p[i][j]] |= 1<<(tot+m-1-j);
   }
   tot += m;
}

unsigned int D = 0;
for (i=0; i<n; i++)
{
   D = ((D << 1) & di) & B[s[i]];
   if (D & fi)
   {
    printf("%d\n", i);
   }
}
}

posted @ 2011-12-12 17:27  balaamwe  阅读(293)  评论(0编辑  收藏  举报