Basic Thought / Data Structure: 前缀和 Prefix Sum
Intro:
在OI中,前缀和是一种泛用性很高的数据结构,也是非常重要的优化思想
Function: 求静态区间和
模板题:输入序列 \(a_{1..n}\) ,对于每一个输入的二元组 \((l,r)\) ,求 \(\sum_{i=l}^ra_i\)
先想一想朴素算法怎么做吧
对于输入的每一组 \((l,r)\) ,遍历序列 \(a_{l..r}\) 求和,代码如下
int s(0);
for(int i(l);i<=r;++i)s+=a[i];
return s;
Time complexity: \(O(n)\)
Memory complexity: \(O(n)\)
如果有m次询问,则总时间复杂度 \(O(nm)\)
观察这个过程,可以发现有大量多余运算,比如说,对于两次询问,它们区间的交集就是被多余运算的
那么有没有方法使得计算量减少呢?
可以发现 \(\sum_{i=l}^ra_i=\sum_{i=1}^ra_i-\sum_{i=1}^{l-1}a_i\)
也就是说如果存在数组 \(s_{1..n}\) 使得 \(s_i=\sum_{j=1}^ia_j\) ,则
\(\sum_{i=l}^ra_i=s_r-s_{l-1}\)
\(s_{1..n}\) 就是传说中的前缀和数组啦!
Operation:
First: 为数组 \(a_{1..n}\) 构造前缀和数组 \(s_{1..n}\)
Second: 对于输入区间 \([l,r]\) ,直接计算出区间和 \(s_r-s_{l-1}\)
关键就是前缀和数组如何构造
使用递推思想
\(s_i=\sum_{j=1}^ia_j=\sum_{j=1}^{i-1}a_j+a_i=s_{i-1}+a_i\)
Code:
求\(s_{1..n}\)
for(int i(1);i<=n;++i)s[i]=s[i-1]+a[i];
询问
return s[r]-s[l-1];
Time complexity: \(O(n)\) 预处理 \(O(1)\) 查询
Memory complexity: \(O(n)\)
P.s 可以直接将原数组变成前缀和数组,则不需要额外空间,代码如下
for(int i(2);i<=n;++i)a[i]+=a[i-1];
Example:
这是一道练习前缀和思想(然而不是特别明显)的经典题目
如果将男生表示 \(1\) ,女生表示 \(-1\) ,那么题目就变成了求能使区间和为\(0\)的最大区间长度(是不是有点前缀和的味道了)
但是单单枚举区间两端, \(O(n^2)\) 的时间复杂度明显超时,而且这种方法根本不需要前缀和(直接求和即可)
这道题的要点在于 \(\sum_{i=l}^ra_i=\sum_{i=1}^ra_i-\sum_{i=1}^{l-1}a_i\) (是不是很眼熟)
所以当 \(\sum_{i=l}^ra_i=0\) 时, \(\sum_{i=1}^ra_i=\sum_{i=1}^{l-1}a_i\)
所以关键在于对于两个端点 \(l,r\) ,如果 \(s_l=s_r\) ,那么 \([l+1,r]\) 就是一个可行区间
对所有端点\(i\),按照\(s_i\)分类,对每一类求极差,取最大值即可
P.s 其中端点 \(0\) 属于 \(s_i=0\) 类
具体见代码( \(s_{1..n}\) 被优化掉了,用 \(p_i,-n\leqslant i\leqslant n\) 表示每一个 \(s_j=i\) 的最小 \(j\) ,若不存在则 \(p_i=-1\) )
//This program is written by Brian Peng.
#pragma GCC optimize("Ofast","inline","-ffast-math")
#pragma GCC target("avx,sse2,sse3,sse4,mmx")
#include<bits/stdc++.h>
using namespace std;
#define Rd(a) (a=read())
#define Gc(a) (a=getchar())
#define Pc(a) putchar(a)
inline int read(){
register int x;register char c(getchar());register bool k;
while(!isdigit(c)&&c^'-')if(Gc(c)==EOF)exit(0);
if(c^'-')k=1,x=c&15;else k=x=0;
while(isdigit(Gc(c)))x=(x<<1)+(x<<3)+(c&15);
return k?x:-x;
}
void wr(register int a){
if(a<0)Pc('-'),a=-a;
if(a<=9)Pc(a|'0');
else wr(a/10),Pc((a%10)|'0');
}
signed const INF(0x3f3f3f3f),NINF(0xc3c3c3c3);
long long const LINF(0x3f3f3f3f3f3f3f3fLL),LNINF(0xc3c3c3c3c3c3c3c3LL);
#define Ps Pc(' ')
#define Pe Pc('\n')
#define Frn0(i,a,b) for(register int i(a);i<(b);++i)
#define Frn1(i,a,b) for(register int i(a);i<=(b);++i)
#define Frn_(i,a,b) for(register int i(a);i>=(b);--i)
#define Mst(a,b) memset(a,b,sizeof(a))
#define File(a) freopen(a".in","r",stdin),freopen(a".out","w",stdout)
#define N (200010)
#define P(a) (p[a+n])
int n,p[N],s,ans;
signed main(){
Rd(n),Mst(p,-1),P(0)=0;
Frn1(i,1,n)s+=read()?1:-1,~P(s)?ans=max(ans,i-P(s)):P(s)=i;
wr(ans),exit(0);
}
到此为止前缀和的所有基本操作都讲完啦!
Conclusion & Extension:
前缀和是一种泛用性很高的数据结构,也是非常重要的优化思想
它利用预处理和递推的方法减少多余运算,达到优化的目的
不仅适用于加法,还适用于所有满足于结合律而且具有单位(对于加法就是 \(0\) )和逆元(对于加法 \(a\) 的逆元是 \(-a\) )的二元运算,如乘法
但是对于求最值就不太靠谱了(对于这类问题(称为RMQ问题)也有很棒的算法)
前缀和数组的online version:树状数组
Particularly, 前缀和还有逆运算:差分
到此为止本篇文章就圆满结束啦,请各位奆佬们多多指教和支持,THX!