【bzoj4259/bzoj4503】残缺的字符串/两个串 FFT

bzoj4259

题目描述

很久很久以前,在你刚刚学习字符串匹配的时候,有两个仅包含小写字母的字符串A和B,其中A串长度为m,B串长度为n。可当你现在再次碰到这两个串时,这两个串已经老化了,每个串都有不同程度的残缺。
你想对这两个串重新进行匹配,其中A为模板串,那么现在问题来了,请回答,对于B的每一个位置i,从这个位置开始连续m个字符形成的子串是否可能与A串完全匹配?

输入

第一行包含两个正整数m,n(1<=m<=n<=300000),分别表示A串和B串的长度。
第二行为一个长度为m的字符串A。
第三行为一个长度为n的字符串B。
两个串均仅由小写字母和*号组成,其中*号表示相应位置已经残缺。

输出

第一行包含一个整数k,表示B串中可以完全匹配A串的位置个数。
若k>0,则第二行输出k个正整数,从小到大依次输出每个可以匹配的开头位置(下标从1开始)。

样例输入

3 7
a*b
aebr*ob

样例输出

2
1 5


bzoj4503

题目描述

几乎同上,只是B串中不含万能字符,更简单些。

题解

FFT

设两个字符c1、c2的差异度为(c1-c2)^2,那么两个普通字符串能匹配,当且仅当∑(str1[i]-str2[i])^2=0

考虑包含万能字符的情况,由于可以匹配任何字符,则应当把差异度看作0。

即:万能字符为0,其它字符为1~26,差异度为c1*c2*(c1-c2)^2。

展开得c1^3*c2 - 2*c1^2*c2^2 + c1*c2^3。

令题中所给的两个字符串计算差异度,可以分成以上3部分来求,并且每部分都可以化成只包含str1和只包含str2的两个式子的乘积。

并且发现两个位置的差是定值,可以翻转后转化为卷积来求。

于是上FFT出解。

对于4503,可以少考虑一种一个字符为万能字符的情况,所以可以少FFT计算,具体见代码。

bzoj4259:

#include <cstdio>
#include <cmath>
#include <algorithm>
#define N 1 << 20
#define pi acos(-1)
#define tra(ch) (ch == '*' ? 0 : ch - 'a' + 1)
using namespace std;
struct data
{
	double x , y;
	data() {x = y = 0;}
	data(double x0 , double y0) {x = x0 , y = y0;}
	data operator+(const data a)const {return data(x + a.x , y + a.y);}
	data operator-(const data a)const {return data(x - a.x , y - a.y);}
	data operator*(const data a)const {return data(x * a.x - y * a.y , x * a.y + y * a.x);}
}a1[N] , b1[N] , a2[N] , b2[N] , a3[N] , b3[N];
char sa[N] , sb[N];
int ans[N] , tot;
void fft(data *a , int n , int flag)
{
	int i , j , k;
	for(i = k = 0 ; i < n ; i ++ )
	{
		if(i > k) swap(a[i] , a[k]);
		for(j = (n >> 1) ; (k ^= j) < j ; j >>= 1);
	}
	for(k = 2 ; k <= n ; k <<= 1)
	{
		data wn(cos(2 * pi * flag / k) , sin(2 * pi * flag / k));
		for(i = 0 ; i < n ; i += k)
		{
			data t , w(1 , 0);
			for(j = i ; j < i + (k >> 1) ; j ++ , w = w * wn)
				t = w * a[j + (k >> 1)] , a[j + (k >> 1)] = a[j] - t , a[j] = a[j] + t;
		}
	}
}
void work(data *a , data *b , int len)
{
	int i;
	fft(a , len , 1) , fft(b , len , 1);
	for(i = 0 ; i < len ; i ++ ) a[i] = a[i] * b[i];
	fft(a , len , -1);
	for(i = 0 ; i < len ; i ++ ) a[i].x = a[i].x / len;
}
int main()
{
	int m , n , i , len;
	double tmp;
	scanf("%d%d%s%s" , &m , &n , sa , sb);
	for(i = 0 ; i < m ; i ++ ) tmp = tra(sa[i]) , a1[m - i - 1].x = tmp , a2[m - i - 1].x = tmp * tmp , a3[m - i - 1].x = tmp * tmp * tmp;
	for(i = 0 ; i < n ; i ++ ) tmp = tra(sb[i]) , b1[i].x = tmp * tmp * tmp , b2[i].x = tmp * tmp , b3[i].x = tmp;
	for(len = 1 ; len < n + m ; len <<= 1);
	work(a1 , b1 , len) , work(a2 , b2 , len) , work(a3 , b3 , len);
	for(i = 0 ; i <= n - m ; i ++ )
		if(!(int)(a1[i + m - 1].x - 2 * a2[i + m - 1].x + a3[i + m - 1].x + 0.1))
			ans[++tot] = i;
	printf("%d\n" , tot);
	for(i = 1 ; i <= tot ; i ++ ) printf("%d " , ans[i] + 1);
	return 0;
}

bzoj4503:

#include <cstdio>
#include <cstring>
#include <cmath>
#include <algorithm>
#define N 1 << 20
#define tra(ch) (ch == '?' ? 0 : ch - 'a' + 1)
#define pi acos(-1)
using namespace std;
struct data
{
	double x , y;
	data() {x = y = 0;}
	data(double x0 , double y0) {x = x0 , y = y0;}
	data operator+(const data a)const {return data(x + a.x , y + a.y);}
	data operator-(const data a)const {return data(x - a.x , y - a.y);}
	data operator*(const data a)const {return data(x * a.x - y * a.y , x * a.y + y * a.x);}
}a1[N] , b1[N] , a2[N] , b2[N];
char sa[N] , sb[N];
int ans[N] , tot;
void fft(data *a , int n , int flag)
{
	int i , j , k;
	for(i = k = 0 ; i < n ; i ++ )
	{
		if(i > k) swap(a[i] , a[k]);
		for(j = (n >> 1) ; (k ^= j) < j ; j >>= 1);
	}
	for(k = 2 ; k <= n ; k <<= 1)
	{
		data wn(cos(2 * pi * flag / k) , sin(2 * pi * flag / k));
		for(i = 0 ; i < n ; i += k)
		{
			data t , w(1 , 0);
			for(j = i ; j < i + (k >> 1) ; j ++ , w = w * wn)
				t = w * a[j + (k >> 1)] , a[j + (k >> 1)] = a[j] - t , a[j] = a[j] + t;
		}
	}
}
void work(data *a , data *b , int len)
{
	int i;
	fft(a , len , 1) , fft(b , len , 1);
	for(i = 0 ; i < len ; i ++ ) a[i] = a[i] * b[i];
	fft(a , len , -1);
	for(i = 0 ; i < len ; i ++ ) a[i].x /= len;
}
int main()
{
	int la , lb , i , len;
	double tmp , a3 = 0;
	scanf("%s%s" , sa , sb) , la = strlen(sa) , lb = strlen(sb);
	for(i = 0 ; i < la ; i ++ ) tmp = tra(sa[i]) , a1[i].x = tmp * tmp , a2[i].x = tmp;
	for(i = 0 ; i < lb ; i ++ ) tmp = tra(sb[i]) , b1[lb - i - 1].x = tmp , b2[lb - i - 1].x = tmp * tmp , a3 += tmp * tmp * tmp;
	for(len = 1 ; len < 2 * la || len < 2 * lb ; len <<= 1);
	work(a1 , b1 , len) , work(a2 , b2 , len);
	for(i = 0 ; i < la - lb + 1 ; i ++ )
		if(!(int)(a1[i + lb - 1].x - 2 * a2[i + lb - 1].x + a3 + 0.1))
			ans[++tot] = i;
	printf("%d\n" , tot);
	for(i = 1 ; i <= tot ; i ++ ) printf("%d\n" , ans[i]);
	return 0;
}

 

 

 

posted @ 2017-05-19 15:51  GXZlegend  阅读(276)  评论(0编辑  收藏  举报