[spoj694&spoj705]New Distinct Substrings(后缀数组)
题意:求字符串中不同子串的个数。
解题关键:每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间的不相同的前缀的个数。
1、总数减去height数组的和即可。
注意这里height中为什么不需要进行组合计数,因为,每一个height的左端点已经确定,所以只需变动右端点,总共$height[i]$种情况。
2、如果所有的后缀按照 suffix(sa[1]), suffix(sa[2]),suffix(sa[3]), …… ,suffix(sa[n])的顺序计算,不难发现,对于每一次新加进来的后缀 suffix(sa[k]),它将产生 n-sa[k]+1 个新的前缀。但是其中有height[k]个是和前面的字符串的前缀是相同的。所以 suffix(sa[k])将“贡献”出 n-sa[k]+1- height[k]个不同的子串。累加后便是原问题的答案。这个做法的时间复杂度为 O(n)。
类似于dp的过程
法一:
1 #include <cstdlib> 2 #include <cstring> 3 #include <cstdio> 4 #include <algorithm> 5 #include<iostream> 6 #include<cmath> 7 #define inf 0x3f3f3f3f 8 typedef long long ll; 9 using namespace std; 10 const int N=200005; 11 int wa[N],wb[N],wv[N],wc[N]; 12 bool cmp(int *r,int a,int b,int l){return r[a]==r[b]&&r[a+l]==r[b+l];} 13 void make_sa(int *r,int *sa,int n,int m){ 14 int i,j,p,*x=wa,*y=wb; 15 for(i=0;i<m;i++) wc[i]=0; 16 for(i=0;i<n;i++) wc[x[i]=r[i]]++; 17 for(i=1;i<m;i++) wc[i]+=wc[i-1]; 18 for(i=n-1;i>=0;i--) sa[--wc[x[i]]]=i; 19 for(j=1,p=1;p<n;j*=2,m=p){ 20 for(p=0,i=n-j;i<n;i++) y[p++]=i; 21 for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; 22 for(i=0;i<n;i++) wv[i]=x[y[i]]; 23 for(i=0;i<m;i++) wc[i]=0; 24 for(i=0;i<n;i++) wc[wv[i]]++; 25 for(i=1;i<m;i++) wc[i]+=wc[i-1]; 26 for(i=n-1;i>=0;i--) sa[--wc[wv[i]]]=y[i]; 27 for(swap(x,y),p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; 28 } 29 return; 30 } 31 int rank1[N],height[N],sa[N]; 32 void make_height(int *r,int *sa,int n){ 33 int i,j,k=0; 34 for(i=1;i<=n;i++) rank1[sa[i]]=i; 35 for(i=0;i<n;height[rank1[i++]]=k) 36 for(k?k--:0,j=sa[rank1[i]-1];r[i+k]==r[j+k];k++); 37 return; 38 } 39 40 int n,k,r[N]; 41 int main(){ 42 int t; 43 ios::sync_with_stdio(0); 44 cin>>t; 45 while(t--){ 46 string s; 47 cin>>s; 48 for(int i=0;i<s.size();i++) r[i]=(int)s[i]; 49 r[s.size()]=0; 50 n=s.size(); 51 make_sa(r,sa,n+1,129); 52 make_height(r,sa,n); 53 ll sum=s.size()*(s.size()+1)/2; 54 for(int i=2;i<=n;i++){ 55 sum-=height[i]; 56 } 57 cout<<sum<<"\n"; 58 } 59 return 0; 60 }
法二:
1 #include <cstdlib> 2 #include <cstring> 3 #include <cstdio> 4 #include <algorithm> 5 #include<iostream> 6 #include<cmath> 7 #define inf 0x3f3f3f3f 8 typedef long long ll; 9 using namespace std; 10 const int N=200005; 11 int wa[N],wb[N],wv[N],wc[N]; 12 bool cmp(int *r,int a,int b,int l){return r[a]==r[b]&&r[a+l]==r[b+l];} 13 void make_sa(int *r,int *sa,int n,int m){ 14 int i,j,p,*x=wa,*y=wb; 15 for(i=0;i<m;i++) wc[i]=0; 16 for(i=0;i<n;i++) wc[x[i]=r[i]]++; 17 for(i=1;i<m;i++) wc[i]+=wc[i-1]; 18 for(i=n-1;i>=0;i--) sa[--wc[x[i]]]=i; 19 for(j=1,p=1;p<n;j*=2,m=p){ 20 for(p=0,i=n-j;i<n;i++) y[p++]=i; 21 for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; 22 for(i=0;i<n;i++) wv[i]=x[y[i]]; 23 for(i=0;i<m;i++) wc[i]=0; 24 for(i=0;i<n;i++) wc[wv[i]]++; 25 for(i=1;i<m;i++) wc[i]+=wc[i-1]; 26 for(i=n-1;i>=0;i--) sa[--wc[wv[i]]]=y[i]; 27 for(swap(x,y),p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; 28 } 29 return; 30 } 31 int rank1[N],height[N],sa[N]; 32 void make_height(int *r,int *sa,int n){ 33 int i,j,k=0; 34 for(i=1;i<=n;i++) rank1[sa[i]]=i; 35 for(i=0;i<n;height[rank1[i++]]=k) 36 for(k?k--:0,j=sa[rank1[i]-1];r[i+k]==r[j+k];k++); 37 return; 38 } 39 40 int n,k,r[N]; 41 int main(){ 42 int t; 43 ios::sync_with_stdio(0); 44 cin>>t; 45 while(t--){ 46 string s; 47 cin>>s; 48 for(int i=0;i<s.size();i++) r[i]=(int)s[i]; 49 r[s.size()]=0; 50 n=s.size(); 51 make_sa(r,sa,n+1,129); 52 make_height(r,sa,n); 53 int sum=0; 54 for(int i=1;i<=n;i++){ 55 sum+=n-sa[i]-height[i]; 56 } 57 cout<<sum<<"\n"; 58 } 59 return 0; 60 }
另:整理下DC3模板(r和sa
1 #include<cstdlib> 2 #include<cstring> 3 #include<cstdio> 4 #include<algorithm> 5 #include<iostream> 6 #include<cmath> 7 #define inf 0x3f3f3f3f 8 typedef long long ll; 9 using namespace std; 10 const int N=50005; 11 #define F(x) ((x)/3+((x)%3==1?0:tb)) 12 #define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2) 13 int wa[N],wb[N],wv[N],ws1[N]; 14 int c0(int *r,int a,int b){ return r[a]==r[b]&&r[a+1]==r[b+1]&&r[a+2]==r[b+2]; } 15 int c12(int k,int *r,int a,int b){ 16 if(k==2) return r[a]<r[b]||r[a]==r[b]&&c12(1,r,a+1,b+1); 17 else return r[a]<r[b]||r[a]==r[b]&&wv[a+1]<wv[b+1]; 18 } 19 void sort(int *r,int *a,int *b,int n,int m){ 20 int i; 21 for(i=0;i<n;i++) wv[i]=r[a[i]]; 22 for(i=0;i<m;i++) ws1[i]=0; 23 for(i=0;i<n;i++) ws1[wv[i]]++; 24 for(i=1;i<m;i++) ws1[i]+=ws1[i-1]; 25 for(i=n-1;i>=0;i--) b[--ws1[wv[i]]]=a[i]; 26 return; 27 } 28 void dc3(int *r,int *sa,int n,int m){ 29 int i,j,*rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p; 30 r[n]=r[n+1]=0; 31 for(i=0;i<n;i++) if(i%3!=0) wa[tbc++]=i; 32 sort(r+2,wa,wb,tbc,m); 33 sort(r+1,wb,wa,tbc,m); 34 sort(r,wa,wb,tbc,m); 35 for(p=1,rn[F(wb[0])]=0,i=1;i<tbc;i++) 36 rn[F(wb[i])]=c0(r,wb[i-1],wb[i])?p-1:p++; 37 if(p<tbc) dc3(rn,san,tbc,p); 38 else for(i=0;i<tbc;i++) san[rn[i]]=i; 39 for(i=0;i<tbc;i++) if(san[i]<tb) wb[ta++]=san[i]*3; 40 if(n%3==1) wb[ta++]=n-1; 41 sort(r,wb,wa,ta,m); 42 for(i=0;i<tbc;i++) wv[wb[i]=G(san[i])]=i; 43 for(i=0,j=0,p=0;i<ta && j<tbc;p++) 44 sa[p]=c12(wb[j]%3,r,wa[i],wb[j])?wa[i++]:wb[j++]; 45 for(;i<ta;p++) sa[p]=wa[i++]; 46 for(;j<tbc;p++) sa[p]=wb[j++]; 47 return; 48 } 49 int rank1[N],height[N],sa[3*N]; 50 void make_height(int *r,int *sa,int n){ 51 int i,j,k=0; 52 for(i=1;i<=n;i++) rank1[sa[i]]=i; 53 for(i=0;i<n;height[rank1[i++]]=k) 54 for(k?k--:0,j=sa[rank1[i]-1];r[i+k]==r[j+k];k++); 55 return; 56 } 57 58 int n,k,r[3*N]; 59 int main(){ 60 int t; 61 ios::sync_with_stdio(0); 62 cin>>t; 63 while(t--){ 64 string s; 65 cin>>s; 66 for(int i=0;i<s.size();i++) r[i]=(int)s[i]; 67 r[s.size()]=0; 68 n=s.size(); 69 dc3(r,sa,n+1,129); 70 make_height(r,sa,n); 71 int sum=0; 72 for(int i=1;i<=n;i++){ 73 sum+=n-sa[i]-height[i]; 74 } 75 cout<<sum<<"\n"; 76 } 77 return 0; 78 }
必须开到3倍大小)