树状数组详解
先来看几个问题吧。
1.什么是树状数组?
顾名思义,就是用数组来模拟树形结构呗。那么衍生出一个问题,为什么不直接建树?答案是没必要,因为树状数组能处理的问题就没必要建树。和Trie树的构造方式有类似之处。
2.树状数组可以解决什么问题
可以解决大部分基于区间上的更新以及求和问题。
3.树状数组和线段树的区别在哪里
树状数组可以解决的问题都可以用线段树解决,这两者的区别在哪里呢?树状数组的系数要少很多,就比如字符串模拟大数可以解决大数问题,也可以解决1+1的问题,但没人会在1+1的问题上用大数模拟。
4.树状数组的优点和缺点
修改和查询的复杂度都是O(logN),而且相比线段树系数要少很多,比传统数组要快,而且容易写。
缺点是遇到复杂的区间问题还是不能解决,功能还是有限。
一、树状数组介绍
二叉树大家一定都知道,如下图
如果每个父亲都存的是两个儿子的值,是不是就可以解决这类区间问题了呢。是的没错,但是这样的树形结构,叫做线段树。
那真的的树形结构是怎样的,和上图类似,但省去了一些节点,以达到用数组建树。
黑色数组代表原来的数组(下面用A[i]代替),红色结构代表我们的树状数组(下面用C[i]代替),发现没有,每个位置只有一个方框,令每个位置存的就是子节点的值的和,则有
- C[1] = A[1];
- C[2] = A[1] + A[2];
- C[3] = A[3];
- C[4] = A[1] + A[2] + A[3] + A[4];
- C[5] = A[5];
- C[6] = A[5] + A[6];
- C[7] = A[7];
- C[8] = A[1] + A[2] + A[3] + A[4] + A[5] + A[6] + A[7] + A[8];
可以发现,这颗树是有规律的
C[i] = A[i - 2k+1] + A[i - 2k+2] + ... + A[i]; //k为i的二进制中从最低位到高位连续零的长度
例如i = 8(1000)时候,k = 3,可自行验证。
这个怎么实现求和呢,比如我们要找前7项和,那么应该是SUM = C[7] + C[6] + C[4];
而根据上面的式子,容易的出SUMi = C[i] + C[i-2k1] + C[(i - 2k1) - 2k2] + .....;
其实树状数组就是一个二进制上面的应用。
现在新的问题来了2^k该怎么求呢,不难得出2^k = i&(i^(i-1));但这个还是不好求出呀,前辈的智慧就出来了,2^k = i&(-i);
为什么呢?
这里利用的负数的存储特性,负数是以补码存储的,对于整数运算 x&(-x)有
● 当x为0时,即 0 & 0,结果为0;
●当x为奇数时,最后一个比特位为1,取反加1没有进位,故x和-x除最后一位外前面的位正好相反,按位与结果为0。结果为1。
●当x为偶数,且为2的m次方时,x的二进制表示中只有一位是1(从右往左的第m+1位),其右边有m位0,故x取反加1后,从右到左第有m个0,第m+1位及其左边全是1。这样,x& (-x) 得到的就是x。
●当x为偶数,却不为2的m次方的形式时,可以写作x= y * (2^k)。其中,y的最低位为1。实际上就是把x用一个奇数左移k位来表示。这时,x的二进制表示最右边有k个0,从右往左第k+1位为1。当对x取反时,最右边的k位0变成1,第k+1位变为0;再加1,最右边的k位就又变成了0,第k+1位因为进位的关系变成了1。左边的位因为没有进位,正好和x原来对应的位上的值相反。二者按位与,得到:第k+1位上为1,左边右边都为0。结果为2^k。
总结一下:x&(-x),当x为0时结果为0;x为奇数时,结果为1;x为偶数时,结果为x中2的最大次方的因子。
而且这个有一个专门的称呼,叫做lowbit,即取2^k。
二、如何建立树状数组
上面已经解释了如何用树状数组求区间和,那么如果我们要更新某一个点的值呢,还是一样的,上面说了C[i] = A[i - 2k+1] + A[i - 2k+2] + ... + A[i],那么如果我们更新某个A[i]的值,则会影响到所有包含有A[i]位置。如果求A[i]包含哪些位置里呢,同理有
A[i] 包含于 C[i + 2k]、C[(i + 2k) + 2k]...;
好,现在已经搞清楚了更新和求和,就可以来建树状数组了。如果上面的求和、更新或者lowbit步骤还没搞懂的化,建议再思考弄懂再往下看。
那么构造一个树状数组则为
int n; int a[1005],c[1005]; //对应原数组和树状数组 int lowbit(int x){ return x&(-x); } void updata(int i,int k){ //在i位置加上k while(i <= n){ c[i] += k; i += lowbit(i); } } int getsum(int i){ //求A[1 - i]的和 int res = 0; while(i > 0){ res += c[i]; i -= lowbit(i); } return res; }
这样就构造了一个树状数组。下面看一道模板题目吧。
6565: 区间操作4
描述
给定n个数列,规定有两种操作,一是修改某个元素,二是求子数列[a,b]的连续和。数列元素个数最多100万个,询问操作最多100万次。
输入
第一行2个整数n,m。n表示输入n个数,m表示m次操作,1<=n,m<=106。
第二行n个整数,代表数列a,a[i]<=106。
接下来m行,每行三个数k,a,b(k=1,表示第a个数加b,b<=106;k=2,表示求子数列[a,b]的连续和)
输出
若干行,表示k=2时,对应子数列[a,b]连续和。
样例输入
3 2
1 2 3
1 2 0
2 1 3
样例输出
6
#include<bits/stdc++.h> using namespace std; typedef long long ll; const int N = 1e6+10,inf = 0x3f3f3f3f; ll c[N]; //c是树状数组,其中c[i] = a[i-2^k+1]+...+a[i](k为在i的二进制形式下末尾0的个数) int n,m,k,a,b; int lowbit(int x) //用lowbit(x)表示2^k k为x在二进制形式下末尾0的个数 { return x&(-x); } void updata(int x,int v) //在序列第x个位置上加上v,并在树状数组中修改元素 { while(x<=n) { c[x]+=v; x+=lowbit(x); } } ll sum(int x) //计算第1个数到第x个数的和 { ll res = 0; while(x>0) { res+=c[x]; x-=lowbit(x); } return res; } int main() { int v; scanf("%d%d",&n,&m); for(int i=1;i<=n;i++) { scanf("%d",&v); updata(i,v); //开始每个元素初始值为0,我们读入数列时直接在对应的位置增加v即可 } for(int i=1;i<=m;i++) { scanf("%d%d%d",&k,&a,&b); if(k==2) printf("%lld\n",sum(b)-sum(a-1)); //计算区间[a,b]的和时,可以分别算出[1,b]和[1,a-1]的和,相减即为[a,b]的和 else updata(a,b); //在第a个位置上加上b } return 0; }