洛谷 P4062 - [Code+#1]Yazid 的新生舞会（权值线段树）

题意：
给出一个序列 \(a\)，求 \(a\) 有多少个子区间 \([l,r]\)，满足这个区间中出现次数最多的数出现次数 \(>\dfrac{r-l+1}{2}\)
\(1 \leq n \leq 5\times 10^5\)

首先肯定要枚举出现次数最多的数是什么，假设为 \(x\)。
记序列中为 \(x\) 的数为 \(+1\)，数列中不为 \(x\) 的数为 \(-1\)，那么 \(x\) 出现次数 \(>\dfrac{r-l+1}{2}\) 等价于该区间中对应的数的和 \(>0\)。
考虑对这个 \(+1,-1\) 的序列做一遍前缀和得到 \(s_i\)，那么满足条件的区间个数即为 \(s_i\) 的顺序对个数。
对于 \(type=1,3\) 的情况，做 \(8\) 次树状数组求顺序对就可以了。

然而对于原题来说这样肯定是不行的，不过发现对于 \(x\) 取什么值，\(1\) 的个数加起来只有 \(n\) 个，这意味着大部分数都是 \(-1\)，那么我们思考能不能拿这个性质做文章呢？
考虑从左到右依次插入一段连续的 \(-1\)，显然这些位置的 \(s\) 值可以形成一段连续的区间（公差为 \(-1\) 的等差数列），不妨设其为 \([L,R]\)。
假设 \(cnt_j\) 为当前 \(s_i=j\) 的 \(i\) 的个数，那么这段区间的贡献就是

\[\sum\limits_{i=L}^{R}\sum\limits_{j=-\infty}^{i-1}cnt_j \]

把这个式子稍微调整一下就可以得到

\[(R-L+1)\times\sum\limits_{j=-\infty}^{L-1}cnt_j+\sum\limits_{j=L}^Rcnt_j\times(R-j) \]

是不是感觉有亿点点可维护？
线段树维护 \(cnt_j\) 的值，支持区间加、求区间 \(cnt_i\) 的和，以及区间 \(i \times cnt_i\) 的和，就可以在 \(\mathcal O(\log n)\) 的时间内求出上面那个式子的值。
由于 \(s_j\) 可能 \(<0\)，所以下标要整体加上一个值。
虽然 \(-1\) 的个数很多，但是连续的 \(-1\) 段的个数是 \(\mathcal O(n)\) 级别的，而我们恰好利用了这个性质将复杂度降了下来。

#include <bits/stdc++.h>
using namespace std;
#define fi first
#define se second
#define fz(i,a,b) for(int i=a;i<=b;i++)
#define fd(i,a,b) for(int i=a;i>=b;i--)
#define ffe(it,v) for(__typeof(v.begin()) it=v.begin();it!=v.end();it++)
#define fill0(a) memset(a,0,sizeof(a))
#define fill1(a) memset(a,-1,sizeof(a))
#define fillbig(a) memset(a,63,sizeof(a))
#define pb push_back
#define ppb pop_back
#define mp make_pair
typedef pair<int,int> pii;
typedef long long ll;
const int MAXN=5e5+5;
int n,a[MAXN];
vector<int> v[MAXN];
struct node{
	int l,r;
	ll val,mul,lz,sumi;
} s[MAXN<<4];
void build(int k,int l,int r){
	s[k].l=l;s[k].r=r;s[k].val=s[k].lz=s[k].mul=0;if(l==r){s[k].sumi=l-MAXN;return;}
	int mid=(l+r)>>1;build(k<<1,l,mid);build(k<<1|1,mid+1,r);
	s[k].sumi=s[k<<1].sumi+s[k<<1|1].sumi;
}
void pushdown(int k){
	if(s[k].lz){
		s[k<<1].val+=(s[k<<1].r-s[k<<1].l+1)*s[k].lz;
		s[k<<1].mul+=s[k<<1].sumi*s[k].lz;s[k<<1].lz+=s[k].lz;
		s[k<<1|1].val+=(s[k<<1|1].r-s[k<<1|1].l+1)*s[k].lz;
		s[k<<1|1].mul+=s[k<<1|1].sumi*s[k].lz;s[k<<1|1].lz+=s[k].lz;
		s[k].lz=0;
	}
}
void modify(int k,int l,int r,int x){
	if(l<=s[k].l&&s[k].r<=r){
		s[k].val+=(s[k].r-s[k].l+1)*x;
		s[k].mul+=s[k].sumi*x;s[k].lz+=x;
		return;
	} pushdown(k);
	int mid=(s[k].l+s[k].r)>>1;
	if(r<=mid) modify(k<<1,l,r,x);
	else if(l>mid) modify(k<<1|1,l,r,x);
	else modify(k<<1,l,mid,x),modify(k<<1|1,mid+1,r,x);
	s[k].val=s[k<<1].val+s[k<<1|1].val;
	s[k].mul=s[k<<1].mul+s[k<<1|1].mul;
}
ll query(int k,int l,int r){
//	printf("%d %d %d\n",k,l,r);
	if(l<=s[k].l&&s[k].r<=r) return s[k].val;
	pushdown(k);int mid=(s[k].l+s[k].r)>>1;
	if(r<=mid) return query(k<<1,l,r);
	else if(l>mid) return query(k<<1|1,l,r);
	else return query(k<<1,l,mid)+query(k<<1|1,mid+1,r);
}
ll queryi(int k,int l,int r){
	if(l<=s[k].l&&s[k].r<=r) return s[k].mul;
	pushdown(k);int mid=(s[k].l+s[k].r)>>1;
	if(r<=mid) return queryi(k<<1,l,r);
	else if(l>mid) return queryi(k<<1|1,l,r);
	else return queryi(k<<1,l,mid)+queryi(k<<1|1,mid+1,r);
}
int main(){
	int qwq;scanf("%d%d",&n,&qwq);
	for(int i=1;i<=n;i++) scanf("%d",&a[i]),v[a[i]].pb(i);
	build(1,0,MAXN<<1);ll ret=0;
	for(int i=0;i<n;i++){
//		printf("%d\n",i);
		int pre=0,sum=0;modify(1,MAXN,MAXN,1);
		for(int j=0;j<v[i].size();j++){
			int cur=v[i][j];
			if(pre+1!=cur){
				int r=sum-1,l=sum-(cur-pre-1);
				ret+=r*query(1,l+MAXN,r+MAXN)-queryi(1,l+MAXN,r+MAXN);
				ret+=(r-l+1)*query(1,0,l-1+MAXN);modify(1,l+MAXN,r+MAXN,1);
				sum-=(cur-pre-1);
			}
			sum++;ret+=query(1,0,sum-1+MAXN);modify(1,sum+MAXN,sum+MAXN,1);
			pre=cur;
		}
		if(pre!=n){
			int r=sum-1,l=sum-(n-pre);
			ret+=r*query(1,l+MAXN,r+MAXN)-queryi(1,l+MAXN,r+MAXN);
			ret+=(r-l+1)*query(1,0,l-1+MAXN);modify(1,l+MAXN,r+MAXN,1);
			sum-=(n-pre);
		}
		pre=0,sum=0;modify(1,MAXN,MAXN,-1);
		for(int j=0;j<v[i].size();j++){
			int cur=v[i][j];
			if(pre+1!=cur){
				int r=sum-1,l=sum-(cur-pre-1);
				modify(1,l+MAXN,r+MAXN,-1);
				sum-=(cur-pre-1);
			}
			sum++;modify(1,sum+MAXN,sum+MAXN,-1);
			pre=cur;
		}
		if(pre!=n){
			int r=sum-1,l=sum-(n-pre);
			modify(1,l+MAXN,r+MAXN,-1);
			sum-=(n-pre);
		}
	}
	printf("%lld\n",ret);
	return 0;
}

upd on 2020.12.4：

考场上想的做法竟然过了！incredible！我还以为它过不了呢/xyx
讲一个 \(n\sqrt{n\log n}\) 的做法。
考虑分块，设一个临界值 \(B\)。
对于每个出现次数 \(\leq B\) 的数，显然它只能对长度 \(<2B\) 的区间产生贡献，枚举每个长度 \(<2B\) 的区间。
对于每个出现次数 \(>B\) 的数，这样的数顶多 \(\dfrac{n}{B}\) 个，对于每一个这样的数搞一遍树状数组求顺序对。
时间复杂度 \(2nB+\dfrac{n^2\log n}{B}\)，根据均值不等式可以算得复杂度最优为 \(n\sqrt{n\log n}\)。
~~woc 这玩意儿真的 nb \(10^9\) 左右给我跑过去了。~~
顺便提一句：考场上我在求 \(<2B\) 的区间的贡献的时候用了 memset 所以 T 掉了还以为是算法本身的锅。

#include <bits/stdc++.h>
using namespace std;
const int MAXN=5e5+5;
typedef long long ll;
int n,sub,a[MAXN];
const int BLK=800;
int cnt[MAXN],f[MAXN];
int sum[MAXN];
int bit[MAXN<<1];
void add(int x,int v){for(int i=x;i<MAXN+MAXN;i+=(i&(-i))) bit[i]+=v;}
int query(int x){int ret=0;for(int i=x;i;i-=(i&(-i))) ret+=bit[i];return ret;}
int solve(){
	for(int i=1;i<=n;i++) f[a[i]]++;
	ll ret=0;
	for(int i=1;i<=n;i++){
		int mx=0,pos=0;
		for(int j=i;j<=n&&j<=i+BLK*2;j++){
			cnt[a[j]]++;if(cnt[a[j]]>mx) mx=cnt[a[j]],pos=a[j];
			if(mx>(j-i+1)/2&&f[pos]<BLK) ret++;
        }
        for(int j=i;j<=n&&j<=i+BLK*2;j++){
			cnt[a[j]]--;
		}
	}
	for(int i=0;i<n;i++){
		if(f[i]<BLK) continue;
		memset(sum,0,sizeof(sum));
		for(int j=1;j<=n;j++){
			if(a[j]==i) sum[j]=sum[j-1]+1;
			else sum[j]=sum[j-1]-1;
		}
		memset(bit,0,sizeof(bit));
		add(MAXN,1);
		for(int j=1;j<=n;j++){
			ret+=query(sum[j]-1+MAXN);
			add(sum[j]+MAXN,1);
		}
	}
	printf("%lld\n",ret);
	return 0;
}
int main(){
	scanf("%d%d",&n,&sub);
	for(int i=1;i<=n;i++) scanf("%d",&a[i]);
	return solve();
}

终于把自爆的心头之恨化解掉了，爽

posted @ 2020-12-03 19:48 tzc_wk 阅读(159) 评论(8) 收藏举报

刷新页面返回顶部

tzc_wk

洛谷 P4062 - [Code+#1]Yazid 的新生舞会（权值线段树）

公告