CF1446D Frequency Problem
一、题目
二、解法
一开始不是很好入手,但是发现限制是至少两个元素出现最多
,特殊情况是全序列出现最多的元素有两种,那么答案是 \(n\)
否则最多的数只有一种,记为 \(x\),不难证明最优的答案是一定包含 \(x\) 的,因为如果不包含 \(x\) 那么可以通过调整使得答案更大,我觉得本质的原因是在于 \(x\) 是可以自由调控的。
利用这个性质可以容易地设计出简单版本的算法,因为 \(a_i\leq 100\),所以可以单独考虑每一种颜色 \(y\) 作为最大颜色的情况,这时候我们可以忽略其它颜色,判断一段区间中 \(x,y\) 出现次数相等,因为如果不合法一定不是最优解,那么把 \(x\) 当成 \(1\),\(y\) 当成 \(-1\),做一个前缀和就可以简单判断了,时间复杂度 \(O(n\cdot 100)\)
困难版本可以考虑值域分块,对于出现次数大于 \(\sqrt n\) 的颜色用简单版做法,时间复杂度 \(O(n\sqrt n)\),其他的颜色我们得到的条件是出现次数都 \(\leq\sqrt n\),为了充分利用这个条件我们枚举答案的出现次数记为 \(t\)
然后枚举右端点 \(r\),维护左端点 \(l\),如果 \([l,r]\) 中有数的出现次数 \(> t\) 那么右移左端点,如果合法更新答案,如果出现次数为 \(t\) 的只有一个(不合法),那么右移左端点也没用,所以不用操作,时间复杂度还是 \(O(n\sqrt n)\)
三、总结
对于一些难以入手的问题,可以先分析一些特殊情况,说不定能简化问题。
根据题目的特性枚举较小量,方便我们的统计。
套路:当某个值域是 \(n\) 级别并且答案涉及值域的时候可以考虑 \(\sqrt n\) 相关的值域分块。
#include <cstdio>
#include <iostream>
#include <cmath>
#include <map>
using namespace std;
const int M = 200005;
int read()
{
int x=0,f=1;char c;
while((c=getchar())<'0' || c>'9') {if(c=='-') f=-1;}
while(c>='0' && c<='9') {x=(x<<3)+(x<<1)+(c^48);c=getchar();}
return x*f;
}
int n,m,t,pd,ans,a[M],cnt[M],mp[2*M];
signed main()
{
n=read();m=sqrt(n);
for(int i=1;i<=n;i++)
{
a[i]=read();
cnt[a[i]]++;
}
//find the element that occur most frequently
for(int i=1;i<=n;i++)
if(cnt[i]>cnt[t]) t=i;
for(int i=1;i<=n;i++)
if(cnt[i]==cnt[t]) pd++;
if(pd>=2)
{
printf("%d\n",n);
return 0;
}
//frequency > sqrt(n)
for(int i=1;i<=n;i++)
if(cnt[i]>m && i!=t)
{
for(int i=0;i<=2*n;i++) mp[i]=0;
mp[0+n]=1;
for(int j=1,now=0;j<=n;j++)
{
if(a[j]==t) now++;
if(a[j]==i) now--;
if(mp[now+n]) ans=max(ans,j-mp[now+n]+1);
if(!mp[now+n]) mp[now+n]=j+1;
}
}
//frequency < sqrt(n)
for(int x=1;x<=m;x++)
{
int tmp=0;
for(int i=1;i<=n;i++) cnt[i]=0;
for(int i=1,j=1;i<=n;i++)
{
cnt[a[i]]++;
if(cnt[a[i]]==x) tmp++;
while(cnt[a[i]]>x)
{
if(cnt[a[j]]==x) tmp--;
cnt[a[j]]--;j++;//move the left point
}
if(tmp>=2) ans=max(ans,i-j+1);
}
}
printf("%d\n",ans);
}