\(\text{Update on 2020.12.20}\)

突然发现自己之前写过,但是现在写了篇新的。。。

所以把新的放这儿吧。

\(\text{Description}\)

传送门

\(\text{Solution}\)

\(len\) 的答案显然是 \(n*(n+1)/2*(n-1)\),我们只用考虑后面的 \(\text{LCP}\)

转化一下就是求任意两个后缀的 \(\text{LCP}\) 之和,放到后缀数组上来说,就是任取 \(1\le i<j\le n\),求一次 \(\min\{h[k]\},(\min\{rk[i],rk[j]\}\le k\le \max\{rk[i],rk[j]\})\),再将每次的答案相加(其中 \(h[i]\) 是后缀排序后第 \(i\) 位与第 \(i-1\) 位的 \(\text{LCP}\)\(rk[i]\) 是编号为 \(i\) 的后缀的排名)。

再转化一下,我们发现这其实就是 \(h\) 数组中任取 \(1\le i<j\le n\),求 \(\min\{h[k]\},(i\le k\le j)\),再将每次的答案相加。

有一个经典的转化:我们可以固定位置 \(pos\),求在 \(pos\) 左边第一个 \(h\) 小于 \(h[pos]\)\(L[pos]\),在 \(pos\) 右边第一个 \(h\) 小于 \(h[pos]\)\(R[pos]\)。答案就是:

\[\sum_{i=1}^n h[i]\times (i-L[i])\times (R[i]-i) \]

是不是哪里有点不对?

上面的转化是在保证没有元素相同,而且可以取 \(i=j\) 的情况。

而这道题的元素可以相同就有点难搞。

还有一个很经典的转化(为什么我全都不会啊喂):可以人为给相同的元素按在数组的顺序赋优先级。

需要注意的是,\(h[i]\) 代表的是 \(i\)\(i-1\)\(\text{LCP}\),就是表示的不是单点,所以之前统计的配对和是 \([L[i],i]\)\([i,R[i]]\),而现在的配对和应该是 \([L[i],i-1]\)\([i,R[i]-1]\)(可以看个示意图)。

\[1\ 2\ 3\ ...\ L[i]\ ...\ i\ ...\ R[i] \]

\[\ \ \ \ \ \ \ \ 6\ \ \ \ \ \ \ \ \ \ \ \ 7\ \ \ \ \ \ \ \ 5 \]

第一排是下标,第二排是 \(h\) 值。

具体做法就是用单调栈维护单增与不减,注释会比较详细。

\(\text{Code}\)

#include <cstdio>

#define rep(i,_l,_r) for(register signed i=(_l),_end=(_r);i<=_end;++i)
#define fep(i,_l,_r) for(register signed i=(_l),_end=(_r);i>=_end;--i)
#define erep(i,u) for(signed i=head[u],v=to[i];i;i=nxt[i],v=to[i])
#define efep(i,u) for(signed i=Head[u],v=to[i];i;i=nxt[i],v=to[i])
#define print(x,y) write(x),putchar(y)

template <class T> inline T read(const T sample) {
    T x=0; int f=1; char s;
    while((s=getchar())>'9'||s<'0') if(s=='-') f=-1;
    while(s>='0'&&s<='9') x=(x<<1)+(x<<3)+(s^48),s=getchar();
    return x*f;
}
template <class T> inline void write(const T x) {
    if(x<0) return (void) (putchar('-'),write(-x));
    if(x>9) write(x/10);
    putchar(x%10^48);
}
template <class T> inline T Max(const T x,const T y) {if(x>y) return x; return y;}
template <class T> inline T Min(const T x,const T y) {if(x<y) return x; return y;}
template <class T> inline T fab(const T x) {return x>0?x:-x;}
template <class T> inline T gcd(const T x,const T y) {return y?gcd(y,x%y):x;}
template <class T> inline T lcm(const T x,const T y) {return x/gcd(x,y)*y;}
template <class T> inline T Swap(T &x,T &y) {x^=y^=x^=y;}

#include <cstring>
#include <iostream>
using namespace std;
typedef long long ll;

const int maxn=5e5+5;

char s[maxn];
int n,m='z',c[maxn],x[maxn],y[maxn],sa[maxn],num,rk[maxn],h[maxn],sta[maxn],tp,pre[maxn],suf[maxn];
ll ans;

void Suffix() {
	rep(i,1,n) ++c[x[i]=s[i]];
	rep(i,2,m) c[i]+=c[i-1];
	fep(i,n,1) sa[c[x[i]]--]=i;
	for(int k=1;k<=n;k<<=1) {
		num=0;
		rep(i,n-k+1,n) y[++num]=i;
		rep(i,1,n) if(sa[i]>k) y[++num]=sa[i]-k;
		rep(i,1,m) c[i]=0;
		rep(i,1,n) ++c[x[i]];
		rep(i,2,m) c[i]+=c[i-1];
		fep(i,n,1) sa[c[x[y[i]]]--]=y[i],y[i]=0;
		swap(x,y);
		x[sa[1]]=1; num=1;
		rep(i,2,n)
			x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
		m=num;
	}
}

void LCP() {
	int k=0;
	rep(i,1,n) rk[sa[i]]=i;
	rep(i,1,n) {
		if(rk[i]==1) continue;
		if(k) --k;
		int j=sa[rk[i]-1];
		while(j+k<=n&&i+k<=n&&s[j+k]==s[i+k]) ++k;
		h[rk[i]]=k;
	}
}

int main() {
	scanf("%s",s+1); n=strlen(s+1);
	Suffix(); LCP();
	sta[0]=1;
	rep(i,2,n) { // 维护单增,如果前面有相等的就停在第一个相等的位置
		while(tp&&h[sta[tp]]>h[i]) --tp;
		++tp;
		pre[sta[tp]=i]=sta[tp-1];
	}
	sta[tp=0]=n+1;
	fep(i,n,1) { // 维护不减
		while(tp&&h[sta[tp]]>=h[i]) --tp;
		++tp;
		suf[sta[tp]=i]=sta[tp-1];
	}
	rep(i,1,n) ans+=1ll*h[i]*(i-pre[i])*(suf[i]-i);
	print(1ll*n*(n+1)/2*(n-1)-2ll*ans,'\n');
	return 0;
}

\(\text{Old Version}\)

\((\displaystyle \sum^{}_{1<=i<j<=n}{i+j})-2*\displaystyle \sum^{}_{1<=i<j<=n}{lcp(suf(i),suf(j))}\)

\(=(n-1)*Σi-2*\displaystyle \sum^{}_{1<=i<j<=n}{lcp(suf(i),suf(j))}\)

\(=\frac{(n-1)*(1+n)*n}{2}-2*\displaystyle \sum^{}_{1<=i<j<=n}{lcp(suf(i),suf(j))}\)

注意前者的\(i\)\(j\)是转换了一下的,为了后面化简顺利。(也就是说前面的\(i\)\(j\)与后面的\(i\)\(j\)不是对应一样的)

我们就可以考虑后面的环节。因为暴枚的时间是\(n\)方,我们肯定过不去。所以只有用一个小一点的枚举。

可以利用\(h\)数组。因为两个后缀的\(lcp\)是排名在它们之间的串的\(h\)值的\(min\)。反过来思考,我们只要计算出以\(i\)为中心的\(h\)值比\(h[i]\)大的连续区间的长度就行了。我们可以用单调栈维护。

统计出两边的个数后我们相乘就能得到\(lcp\)\(h[i]\)的区间个数了。

注意处理最后仍未被弹出栈的元素。

#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <iostream>
using namespace std;

const int N = 5e5 + 3;

long long ans;
int cnt, l[N], r[N], s[N], lg[N], T, rmq[N][20], n, m, h[N], tax[N], SA[N], tp[N], rk[N], a[N];

int read() {
	int x = 0, f = 1; char S;
	while((S = getchar()) > '9' || S < '0') {
		if(S == '-') f = -1;
		if(S == EOF) exit(0);
	}
	while(S <= '9' && S >= '0') {
		x = (x << 1) + (x << 3) + (S ^ 48);
		S = getchar();
	}
	return x * f;
}

bool cmp(const int x, const int y, const int d) {return tp[x] == tp[y] && tp[x + d] == tp[y + d];}

void Sort() {
    for(int i = 0; i <= m; ++ i) tax[i] = 0;
    for(int i = 1; i <= n; ++ i) ++ tax[rk[tp[i]]];
    for(int i = 1; i <= m; ++ i) tax[i] += tax[i - 1];
    for(int i = n; i >= 1; -- i) SA[tax[rk[tp[i]]] --] = tp[i];
}

void Swap(int &x, int &y) {
    x ^= y ^= x ^= y;
}

int Min(const int x, const int y) {
    if(x < y) return x;
    return y;
}

void Suffix() {
    for(int i = 1; i <= n; ++ i) rk[i] = a[i], tp[i] = i;
    m = 122; Sort();
    for(int w = 1, p = 1, i; p < n; m = p, w <<= 1) {
        for(p = 0, i = n - w + 1; i <= n; ++ i) tp[++ p] = i;
        for(i = 1; i <= n; ++ i) if(SA[i] > w) tp[++ p] = SA[i] - w;
        Sort(); swap(rk, tp); rk[SA[1]] = p = 1;
        for(i = 2; i <= n; ++ i) rk[SA[i]] = cmp(SA[i], SA[i - 1], w) ? p : ++ p;
    }
    int j, k = 0;
    for(int i = 1; i <= n; h[rk[i ++]] = k)
        for(k = k ? k - 1 : k, j = SA[rk[i] - 1]; a[i + k] == a[j + k]; ++ k);
    for(int i = 1; i <= n; ++ i) rmq[i][0] = h[i];
    for(int j = 1; (1 << j) <= n; ++ j)
        for(int i = 1; i + (1 << j) - 1 <= n; ++ i)
            rmq[i][j] = Min(rmq[i][j - 1], rmq[i + (1 << j - 1)][j - 1]);
}

int lcp(const int x, const int y) {
    int l = rk[x], r = rk[y];
    if(l > r) Swap(l, r);
    int t = lg[r - l];
    return Min(rmq[l + 1][t], rmq[r - (1 << t) + 1][t]);
}

int main() {
    char ch[N];
    scanf("%s", ch); n = strlen(ch);
    for(int i = 1; i <= n; ++ i) a[i] = ch[i - 1];
    Suffix();
    ans = 1ll * n * (n - 1) * (n + 1) / 2;
    s[cnt = 1] = 1;
    for(int i = 2; i <= n; ++ i) {
        while(cnt && h[s[cnt]] > h[i]) r[s[cnt --]] = i;
        l[i] = s[cnt];
        s[++ cnt] = i;
    }
    while(cnt) r[s[cnt --]] = n + 1;
    for(int i = 2; i <= n; ++ i)
        ans -= 2ll * (i - l[i]) * (r[i] - i) * h[i];
    printf("%lld\n", ans);
    return 0;
}

posted on 2020-12-21 21:52  Oxide  阅读(163)  评论(0编辑  收藏  举报