CDQ分治 & 整体分治

Part 1:CDQ分治

CDQ分治讲解博客

可以把CDQ分治理解为类似与归并排序求逆序对个数的一种分治算法(至少我现在是这么想的)。先处理完左右两边各自对答案的贡献,在处理跨越左右两边的对答案的贡献。

例题:

逆序对(二维偏序)

过水,不讲。

三维偏序

第一维先sort,第二维由归并保证,第三维在归并时查询权值树状数组。

\(Code:\)

int n, k, tot;
struct node{
	int a, b, c, w, id;
}p[N], tp[N];
int ans[N];
ll tre[NN];
inline void add(int cur, int ad) {
	for (register int i = cur; i <= k; i += lowbit(i)) {
		tre[i] += ad;
	}
}
inline ll query(int cur) {
	ll res = 0;
	for (register int i = cur; i; i -= lowbit(i)) {
		res += tre[i];
	}
	return res;
}
bool cmp(const node &a, const node &b) {
	if (a.a == b.a) {
		if (a.b == b.b) {
			return a.c < b.c;
		} else {
			return a.b < b.b;
		}
	}
	return a.a < b.a;
}
inline bool comp(const node &a, const node &b) {
	return a.a == b.a && a.b == b.b && a.c == b.c;
}
void cdq(int l, int r) {
	if (l == r) {
		ans[p[l].id] += p[l].w;
		return ;
	}
	int mid = (l + r) >> 1;
	cdq(l, mid); cdq(mid + 1, r);
	int i = l, j = mid + 1, top = l - 1;
	while (i <= mid && j <= r) {
		if (p[i].b <= p[j].b) {
			tp[++top] = p[i];
			add(p[i].c, p[i].w);
			++i;
		} else {
			ans[p[j].id] += query(p[j].c);
			tp[++top] = p[j];
			++j;
		}
	}
	while (i <= mid) {
		tp[++top] = p[i];
		add(p[i].c, p[i].w);
		++i;
	}
	while (j <= r) {
		ans[p[j].id] += query(p[j].c);
		tp[++top] = p[j];
		++j;
	}
	for (register int i = l; i <= mid; ++i) {
		add(p[i].c, -p[i].w);
	}
	for (register int i = l; i <= r; ++i) {
		p[i] = tp[i];
	}
}
ll bin[N];
int main() {
	read(n); read(k);
	int aa, bb, cc;
	for (register int i = 1; i <= n; ++i) {
		read(aa); read(bb); read(cc);
		p[i + 1] = (node){aa, bb, cc, 1, i};
	}
	sort(p + 2, p + 2 + n, cmp);
	for (register int i = 1; i <= n; ++i) {//去重
		if (!comp(p[i], p[i + 1])) {
			p[++tot] = p[i + 1];
		} else {
			p[tot].w++;
		}
	}
	cdq(1, tot);
    ...
}

P3120 [USACO15FEB]Cow Hopscotch G

题意

现有递推式:

\[f[i][j] = \sum_{u>i,v>j,id[u][v] \not = id[i][j]}{f[u][v]} \]

\[f[n][m] = 1 \]

其中 \(n, m<=750,id[i][j] <= n * m\),求 \(f[1][1]\)

题解

一看是三维偏序,我们就应该能想到CDQ分治

\(id[u][v] \not= id[i][j]\) 可以拆成严格大于和严格小于,然后就是俩三维偏序问题了。把对行数的分治套在外面,列直接暴力。我们从右往左枚举每一列,这样枚举到上面的时候,其右下部分都已经被统计。 实际上,我们还有更好的方法,不用拆 \(\not =\),放弃树状数组,能砍掉一个 \(log\)。具体方法是:我们可以直接维护当前 \(f\) 的总和 \(Tot\),以及其中每一个颜色编号的总和 \(sum[id]\)。由于 \(id\) 比较稀疏,我们无法每次都清空 \(sum\),因此我们记一个 \(T\),表示记录信息的时间,如果发现时间与当前不符的话,就清空重记。

然而,本题还和普通CDQ分治不同,我们原先并不知道每个位置的值,只有我们查询完以后才知道。因此我们可以采用分治FFT的方法,先递归下面,然后算下对上的贡献,最后递归上面。

关键代码:

inline void sol(int U, int D) {
	if (U == D)	return ;
	int mid = (U + D) >> 1;
	sol(mid + 1, D);
	++nwtime;
	int Tot = 0;
	for (register int j = m; j; --j) {
		for (register int i = U; i <= mid; ++i) {
			if (T[h[i][j]] != nwtime) { T[h[i][j]] = nwtime, sum[h[i][j]] = 0; }
			f[i][j] = f[i][j] + Tot - sum[h[i][j]];
			if (f[i][j] >= P)	f[i][j] -= P;
			if (f[i][j] < 0)	f[i][j] += P;
		}
		for (register int i = mid + 1; i <= D; ++i) {
			if (T[h[i][j]] != nwtime) { T[h[i][j]] = nwtime, sum[h[i][j]] = 0; }
			ADD(Tot, f[i][j]);
			ADD(sum[h[i][j]], f[i][j]);
		}
	}
	sol(U, mid);
}

四维偏序

寻找宝藏

(其实更模板的题是 德丽莎世界第一可爱,但是那个题数据范围不明确且数据太弱)

CDQ套CDQ套树状数组。假设四维分别为 \(x,y,z,w\)。对第一维排序后外层CDQ考虑左边对右边的影响,此时可以保证 \(x\) 单调。将左边的标为黑色,右边的标为白色,然后对第二维 sort,此时第二维单调但是第一维混乱。我们可以把黑色当成修改,白色当成查询,然后就是经典CDQ问题了,里面套一个CDQ即可。

复杂度:\(O(n \log^3 n)\)

注意:排序一定要彻底!对第二维排序的同时也要一第一维为第四关键字啊!不然会

inline bool cmp_A(const node &a, const node &b) {
	if (a.A ^ b.A)	return a.A < b.A;
	if (a.B ^ b.B)	return a.B < b.B;
	if (a.C ^ b.C)	return a.C < b.C;
	return a.D < b.D;
}
inline bool cmp_B(const node &a, const node &b) {//BUG
	if (a.B ^ b.B)	return a.B < b.B;
	if (a.C ^ b.C)	return a.C < b.C;
	if (a.D ^ b.D)	return a.D < b.D;
	return a.A < b.A;
}
inline bool cmp_C(const node &a, const node &b) {//BUG
	if (a.C ^ b.C)	return a.C < b.C;
	if (a.D ^ b.D)	return a.D <  b.D;
	if (a.A ^ b.A)	return a.A < b.A;
	return a.B < b.B;
}
...
void cdq(int L, int R) {
	if (L == R)	return ;
	int mid = (L + R) >> 1; cdq(L, mid);
	for (int i = L; i <= R; ++i) {
		nddd[i] = ndd[i];
		if (i > mid)	nddd[i].c ^= 2;
	}
	sort(nddd + L, nddd + R + 1, cmp_C);
	for (int i = L; i <= R; ++i) {
		if (nddd[i].c == 0) {
			BIT::add(nddd[i].D, ans[nddd[i].id]);
		} else if (nddd[i].c == 3) {
			PLI pr = BIT::query(nddd[i].D);
			if (pr.first)	pr.first += nddd[i].v.first, ans[nddd[i].id] = ans[nddd[i].id] + pr;
		}
	}
	for (int i = L; i <= R; ++i)	if (nddd[i].c == 0) BIT::clear(nddd[i].D);
	cdq(mid + 1, R);
}

void CDQ(int L, int R) {
	if (L == R)	return ;
	int mid = (L + R) >> 1; CDQ(L, mid);
	for (int i = L; i <= R; ++i) ndd[i] = nd[i], ndd[i].c = i > mid;
	sort(ndd + L, ndd + R + 1, cmp_B);
	cdq(L, R);
	CDQ(mid + 1, R);
}

习题

动态逆序对

  • 提示:三维为标号顺序,时间,大小关系

[Violet]天使玩偶/SJY摆棋子

  • 提示:最值树状数组;三维为时间,横坐标,纵坐标

Part 2:整体分治

如果说 CDQ 分治是基于时间的分治算法,那么整体分治实际上就是基于值域的整体分治算法

具体讲解lyd书上已经讲得很不错了。这里说一下我的看法:

整体分治的一个经典应用为带(单点)修改的同时查询区间第k大。我们把操作离线下来,就变成了“支持单点修改的区间第k大”。由于要保证时间的关系,因此不能将其它的重新排序来搞事情。

CDQ 分治的做法是二分时间,递归子问题,然后右面累加上左面的贡献。整体分治可以理解为:二分值域,先搞定左面对右面的贡献,然后一块递归子问题去求解。类似权值线段树求第k大,“搞定左对右的贡献”的方法就是 \(k -= tmp\),其中 \(tmp\) 为小于 \(mid\) 的元素个数,这个要用树状数组查询。由于是暂仅考虑左面(小者)对右面(大者)的贡献,因此树状数组维护的是比 \(mid\) 小的位置的权值树状数组。感觉越说越乱

细节还是看代码吧

代码较丑,说一下易错点:

  1. 数组大小要开三倍!!(因为每个查询操作可能会带来俩操作)

  2. 注意真的修改 \(a\) 数组的值!!

例题:P2617 Dynamic Rankings:动态区间第 \(k\)

题意同上。

做法:1.离线 2.对值域二分,将离线下来的一系列操作按照值域分成两组,递归解决

struct operations {
	int type, x, y, z, id;
	//两种可能。type=1/-1:x(值)y(useless)k(useless)id(位置)	(add/delete)
	//type = 0: x(left)y(right)k(k)id(位置)	(query)
}opts[N], ql[N], qr[N];
void sol(int L, int R, int st, int ed) {
	if (st > ed)	return ;
	if (L == R) {
		for (register int i = st; i <= ed; ++i)
			if (opts[i].type == 0)
				ans[opts[i].id] = L;
		return ;
	}
	int ltop = 0, rtop = 0, mid = (L + R) >> 1;
	for (register int i = st; i <= ed; ++i) {
		if (opts[i].type == 0) {
			int tmp = q(opts[i].y) - q(opts[i].x - 1);
			if (opts[i].k <= tmp)	ql[++ltop] = opts[i];
			else	opts[i].k -= tmp, qr[++rtop] = opts[i];
		} else {
			if (opts[i].x <= mid)	ad(opts[i].id, opts[i].type), ql[++ltop] = opts[i];
			else	qr[++rtop] = opts[i];
		}
	}
	for (register int i = st; i <= ed; ++i)
		if (opts[i].type != 0)
			tre_clear(opts[i].id);
	for (register int i = 1; i <= ltop; ++i)
		opts[st - 1 + i] = ql[i];
	for (register int i = 1; i <= rtop; ++i)
		opts[st - 1 + ltop + i] = qr[i];
	sol(L, mid, st, st + ltop - 1);
	sol(mid + 1, R, st + ltop, ed);
}
...
//main()
for (register int i = 1; i <= n; ++i) {
	read(a[i]);
	opts[++otot] = (operations){1, a[i], 0, 0, i};
}
char opt[10];
for (register int i = 1; i <= m; ++i) {
	scanf("%s", opt);
	if (opt[0] == 'Q') {
		read(aa); read(bb); read(cc);
		opts[++otot] = (operations){0, aa, bb, cc, ++atot};
	} else {
		read(aa); read(bb);
		opts[++otot] = (operations){-1, a[aa], 0, 0, aa};
		a[aa] = bb;
		opts[++otot] = (operations){1, a[aa], 0, 0, aa};
	}
}
sol(1, ltot, 1, otot);

例题:P3527 [POI2011]MET-Meteors:整体分治算法的优化

题意:维护长为 \(n\) 的带颜色序列,支持 \(m\) 次区间加(非负数)。最后查询每种颜色最早在什么时候权值总和达到了 \(p_i\)

\(1 <= n, m <= 3e5\)

整体二分的扩展应用。

考虑到整体分治算法实际上是对二分算法的一个优化,相当于把一堆二分任务一块完成,因此我们最好先想出二分暴力 \(O(nmlogn)\) 的算法,再想法优化到 \(O(nlog^2n)\)

二分的算法不难想出,因而整体分治的算法也不难想出。一种简便的处理 "NIE" 的方法为将总时间设置为 \(m + 1\),且第 \(m + 1\) 次设置为全部加正无穷,这样答案为 \(m + 1\) 实际上就是 "NIE"。

随便敲了个整体分治,然而TLE了 (尽管后来卡常卡过去了) 。毕竟整体二分是 \(O(nlog^2n)\) 的,对于 \(3e5\) 的数据不是很好卡。

这里介绍一种优化方法

考虑到每种“时间”唯一对应一步操作,如果我们把它们也当作真的“操作”,每次都加入删除的话,比较费时间。不妨我们动态地加删,用什么就留什么。

具体来说,就是维护指针 \(nwt\) 表示现在 \(nwt\) 及其之前的时间的操作都累加上了, \(nwt\) 以后的操作还没有累加。我们通过不停的调整 \(nwt\),使得树状数组里面存的是我们想要的那个时间区间(1~mid)。这样就可以省去清空树状数组的时间。(实际上就是动态清空)

值得注意的是,如果用这种优化方法的话,我们就不用再每次对真“操作”的 \(k\) 都减去 \(sum\) 了,因为我们的 \(sum\) 是真的所有小于 \(mid\) 的和,而不是区间内部小于 \(mid\) 的和。

\(Code:\)

int nwt;
void sol(int L, int R, int st, int ed) {
	if (st > ed)	return ;
	if (L == R) {
		for (register int i = st; i <= ed; ++i)
			ans[opts[i].id] = L;
		return ;
	}
	int ltop = 0, rtop = 0, mid = (L + R) >> 1;
	while (nwt < mid)	nwt++, change(nwt, c[nwt]);//<= mid : add
	while (nwt > mid)	change(nwt, -c[nwt]), nwt--;//> mid : delete
	for (register int i = st; i <= ed; ++i) {
		ll sum = 0;
		int id = opts[i].id;
		for (register int j = 0; j < stat[id].size(); ++j) {
			sum += q(stat[id][j]);
			if (sum >= opts[i].x) {
				sum = opts[i].x;
				break;
			}
		}
		if (opts[i].x <= sum)	ql[++ltop] = opts[i];
		else	qr[++rtop] = opts[i];
	}
	for (register int i = 1; i <= ltop; ++i)
		opts[st - 1 + i] = ql[i];
	for (register int i = 1; i <= rtop; ++i)
		opts[st - 1 + ltop + i] = qr[i];
	sol(L, mid, st, st + ltop - 1);
	sol(mid + 1, R, st + ltop, ed);
}

例题:P1527 [国家集训队]矩阵乘法:二维数组的整体分治算法

题意:矩阵中询问子矩阵的第 k 大。

除了树状数组改为二维以外,无特殊的地方。同普通的整体分治求第k大。

介绍一种错误算法:

inline void tre_clear(int cur_x, int cur_y) {
	for (register int i = cur_x; i <= n; i += lowbit(i))
		for (register int j = cur_y; j <= n; j += lowbit(j)) {
			//if (!tre[i][j])	return ;
			tre[i][j] = 0;
		}
}

将注释掉的代码加上将导致WA。但是不知道原因。可能原因比较复杂,尽量避免就好。

\(Code:\)my record

posted @ 2020-07-14 14:51  JiaZP  阅读(264)  评论(0编辑  收藏  举报