洛谷 P4062 - [Code+#1]Yazid 的新生舞会(权值线段树)
题意:
给出一个序列 \(a\),求 \(a\) 有多少个子区间 \([l,r]\),满足这个区间中出现次数最多的数出现次数 \(>\dfrac{r-l+1}{2}\)
\(1 \leq n \leq 5\times 10^5\)
首先肯定要枚举出现次数最多的数是什么,假设为 \(x\)。
记序列中为 \(x\) 的数为 \(+1\),数列中不为 \(x\) 的数为 \(-1\),那么 \(x\) 出现次数 \(>\dfrac{r-l+1}{2}\) 等价于该区间中对应的数的和 \(>0\)。
考虑对这个 \(+1,-1\) 的序列做一遍前缀和得到 \(s_i\),那么满足条件的区间个数即为 \(s_i\) 的顺序对个数。
对于 \(type=1,3\) 的情况,做 \(8\) 次树状数组求顺序对就可以了。
然而对于原题来说这样肯定是不行的,不过发现对于 \(x\) 取什么值,\(1\) 的个数加起来只有 \(n\) 个,这意味着大部分数都是 \(-1\),那么我们思考能不能拿这个性质做文章呢?
考虑从左到右依次插入一段连续的 \(-1\),显然这些位置的 \(s\) 值可以形成一段连续的区间(公差为 \(-1\) 的等差数列),不妨设其为 \([L,R]\)。
假设 \(cnt_j\) 为当前 \(s_i=j\) 的 \(i\) 的个数,那么这段区间的贡献就是
把这个式子稍微调整一下就可以得到
是不是感觉有亿点点可维护?
线段树维护 \(cnt_j\) 的值,支持区间加、求区间 \(cnt_i\) 的和,以及区间 \(i \times cnt_i\) 的和,就可以在 \(\mathcal O(\log n)\) 的时间内求出上面那个式子的值。
由于 \(s_j\) 可能 \(<0\),所以下标要整体加上一个值。
虽然 \(-1\) 的个数很多,但是连续的 \(-1\) 段的个数是 \(\mathcal O(n)\) 级别的,而我们恰好利用了这个性质将复杂度降了下来。
#include <bits/stdc++.h>
using namespace std;
#define fi first
#define se second
#define fz(i,a,b) for(int i=a;i<=b;i++)
#define fd(i,a,b) for(int i=a;i>=b;i--)
#define ffe(it,v) for(__typeof(v.begin()) it=v.begin();it!=v.end();it++)
#define fill0(a) memset(a,0,sizeof(a))
#define fill1(a) memset(a,-1,sizeof(a))
#define fillbig(a) memset(a,63,sizeof(a))
#define pb push_back
#define ppb pop_back
#define mp make_pair
typedef pair<int,int> pii;
typedef long long ll;
const int MAXN=5e5+5;
int n,a[MAXN];
vector<int> v[MAXN];
struct node{
int l,r;
ll val,mul,lz,sumi;
} s[MAXN<<4];
void build(int k,int l,int r){
s[k].l=l;s[k].r=r;s[k].val=s[k].lz=s[k].mul=0;if(l==r){s[k].sumi=l-MAXN;return;}
int mid=(l+r)>>1;build(k<<1,l,mid);build(k<<1|1,mid+1,r);
s[k].sumi=s[k<<1].sumi+s[k<<1|1].sumi;
}
void pushdown(int k){
if(s[k].lz){
s[k<<1].val+=(s[k<<1].r-s[k<<1].l+1)*s[k].lz;
s[k<<1].mul+=s[k<<1].sumi*s[k].lz;s[k<<1].lz+=s[k].lz;
s[k<<1|1].val+=(s[k<<1|1].r-s[k<<1|1].l+1)*s[k].lz;
s[k<<1|1].mul+=s[k<<1|1].sumi*s[k].lz;s[k<<1|1].lz+=s[k].lz;
s[k].lz=0;
}
}
void modify(int k,int l,int r,int x){
if(l<=s[k].l&&s[k].r<=r){
s[k].val+=(s[k].r-s[k].l+1)*x;
s[k].mul+=s[k].sumi*x;s[k].lz+=x;
return;
} pushdown(k);
int mid=(s[k].l+s[k].r)>>1;
if(r<=mid) modify(k<<1,l,r,x);
else if(l>mid) modify(k<<1|1,l,r,x);
else modify(k<<1,l,mid,x),modify(k<<1|1,mid+1,r,x);
s[k].val=s[k<<1].val+s[k<<1|1].val;
s[k].mul=s[k<<1].mul+s[k<<1|1].mul;
}
ll query(int k,int l,int r){
// printf("%d %d %d\n",k,l,r);
if(l<=s[k].l&&s[k].r<=r) return s[k].val;
pushdown(k);int mid=(s[k].l+s[k].r)>>1;
if(r<=mid) return query(k<<1,l,r);
else if(l>mid) return query(k<<1|1,l,r);
else return query(k<<1,l,mid)+query(k<<1|1,mid+1,r);
}
ll queryi(int k,int l,int r){
if(l<=s[k].l&&s[k].r<=r) return s[k].mul;
pushdown(k);int mid=(s[k].l+s[k].r)>>1;
if(r<=mid) return queryi(k<<1,l,r);
else if(l>mid) return queryi(k<<1|1,l,r);
else return queryi(k<<1,l,mid)+queryi(k<<1|1,mid+1,r);
}
int main(){
int qwq;scanf("%d%d",&n,&qwq);
for(int i=1;i<=n;i++) scanf("%d",&a[i]),v[a[i]].pb(i);
build(1,0,MAXN<<1);ll ret=0;
for(int i=0;i<n;i++){
// printf("%d\n",i);
int pre=0,sum=0;modify(1,MAXN,MAXN,1);
for(int j=0;j<v[i].size();j++){
int cur=v[i][j];
if(pre+1!=cur){
int r=sum-1,l=sum-(cur-pre-1);
ret+=r*query(1,l+MAXN,r+MAXN)-queryi(1,l+MAXN,r+MAXN);
ret+=(r-l+1)*query(1,0,l-1+MAXN);modify(1,l+MAXN,r+MAXN,1);
sum-=(cur-pre-1);
}
sum++;ret+=query(1,0,sum-1+MAXN);modify(1,sum+MAXN,sum+MAXN,1);
pre=cur;
}
if(pre!=n){
int r=sum-1,l=sum-(n-pre);
ret+=r*query(1,l+MAXN,r+MAXN)-queryi(1,l+MAXN,r+MAXN);
ret+=(r-l+1)*query(1,0,l-1+MAXN);modify(1,l+MAXN,r+MAXN,1);
sum-=(n-pre);
}
pre=0,sum=0;modify(1,MAXN,MAXN,-1);
for(int j=0;j<v[i].size();j++){
int cur=v[i][j];
if(pre+1!=cur){
int r=sum-1,l=sum-(cur-pre-1);
modify(1,l+MAXN,r+MAXN,-1);
sum-=(cur-pre-1);
}
sum++;modify(1,sum+MAXN,sum+MAXN,-1);
pre=cur;
}
if(pre!=n){
int r=sum-1,l=sum-(n-pre);
modify(1,l+MAXN,r+MAXN,-1);
sum-=(n-pre);
}
}
printf("%lld\n",ret);
return 0;
}
upd on 2020.12.4:
考场上想的做法竟然过了!incredible!我还以为它过不了呢/xyx
讲一个 \(n\sqrt{n\log n}\) 的做法。
考虑分块,设一个临界值 \(B\)。
对于每个出现次数 \(\leq B\) 的数,显然它只能对长度 \(<2B\) 的区间产生贡献,枚举每个长度 \(<2B\) 的区间。
对于每个出现次数 \(>B\) 的数,这样的数顶多 \(\dfrac{n}{B}\) 个,对于每一个这样的数搞一遍树状数组求顺序对。
时间复杂度 \(2nB+\dfrac{n^2\log n}{B}\),根据均值不等式可以算得复杂度最优为 \(n\sqrt{n\log n}\)。
woc 这玩意儿真的 nb \(10^9\) 左右给我跑过去了。
顺便提一句:考场上我在求 \(<2B\) 的区间的贡献的时候用了 memset 所以 T 掉了还以为是算法本身的锅。
#include <bits/stdc++.h>
using namespace std;
const int MAXN=5e5+5;
typedef long long ll;
int n,sub,a[MAXN];
const int BLK=800;
int cnt[MAXN],f[MAXN];
int sum[MAXN];
int bit[MAXN<<1];
void add(int x,int v){for(int i=x;i<MAXN+MAXN;i+=(i&(-i))) bit[i]+=v;}
int query(int x){int ret=0;for(int i=x;i;i-=(i&(-i))) ret+=bit[i];return ret;}
int solve(){
for(int i=1;i<=n;i++) f[a[i]]++;
ll ret=0;
for(int i=1;i<=n;i++){
int mx=0,pos=0;
for(int j=i;j<=n&&j<=i+BLK*2;j++){
cnt[a[j]]++;if(cnt[a[j]]>mx) mx=cnt[a[j]],pos=a[j];
if(mx>(j-i+1)/2&&f[pos]<BLK) ret++;
}
for(int j=i;j<=n&&j<=i+BLK*2;j++){
cnt[a[j]]--;
}
}
for(int i=0;i<n;i++){
if(f[i]<BLK) continue;
memset(sum,0,sizeof(sum));
for(int j=1;j<=n;j++){
if(a[j]==i) sum[j]=sum[j-1]+1;
else sum[j]=sum[j-1]-1;
}
memset(bit,0,sizeof(bit));
add(MAXN,1);
for(int j=1;j<=n;j++){
ret+=query(sum[j]-1+MAXN);
add(sum[j]+MAXN,1);
}
}
printf("%lld\n",ret);
return 0;
}
int main(){
scanf("%d%d",&n,&sub);
for(int i=1;i<=n;i++) scanf("%d",&a[i]);
return solve();
}
终于把自爆的心头之恨化解掉了,爽