决策单调性胡扯笔记

2019 年，第一届 CSP 认证的考场上，作为选手的asuldb打开了第二题。经过一番观察，他认为这道题存在决策单调性，于是开始乱写最终发现过不了样例。

最终asuldb对该题设计出了一个暴力程序，对于一组规模为\(u\)的数据，该程序的运行时间极有可能是\(u^2\)，之后又由于asuldb写错了输出，他只获得了60pts的好成绩。

之后他得知这道题只是一个普通的单调队列优化，于是他自闭了。

于是自闭的asuldb前几天决定来学一学决策单调性，看看决策单调性到底是个什么东西

大致可以分成两种策略

一、分治

主要用于优化满足决策点单调，且同一层dp值无关的问题，即\(dp_i=\max_{j<i}f_j+w_{j+1,i}\)这类的dp，需要满足四边形不等式

四边形不等式：对于\(a\leq b\leq c\leq d\)，如果满足\(w_{b,c}+w_{a,d}\leq w_{a,c}+w_{b,d}\)那么就会存在决策点单调可以使用分治的策略优化

具体的分治方法就是我们对于一个区间\([l,r]\)我们取其中点\(mid\)在相应的决策点区间\([x,y]\)找到最优的决策点\(k\)，那么\([l,mid-1]\)的可能决策点区间就是\([x,k]\)，\([mid+1,y]\)的可能决策点区间就是\([k,y]\)；分治这两个区间就好了，复杂度显示是\(O(n\log n)\)的

一道经典的例题cf868f

首先来证明一下为什么会满足四边形不等式，我们找到一组\(a\leq b\leq c\)，使得\(d\)从\(c\)开始递增，对于\(w_{b,c}+w_{a,d}\)，\(d\)每增加\(1\)产生的贡献是\([b,c],[a,d-1]\)里和\(d\)相同的数的个数；这个数显然要少于\([a,c],[b,d-1]\)里和\(d\)相同的个数，于是有决策单调性，我们可以使用分治的策略解决这个问题

代码

#include<bits/stdc++.h>
#define re register
#define LL long long
const int maxn=1e5+5;
inline int read() {
	char c=getchar();int x=0;while(c<'0'||c>'9')c=getchar();
	while(c>='0'&&c<='9')x=(x<<3)+(x<<1)+c-48,c=getchar();return x;
}
int n,m,L,R,a[maxn],tax[maxn];
LL g[maxn],dp[maxn],nw;
inline void add(int c,int v) {
	nw-=1ll*tax[c]*(tax[c]-1)/2ll;
	tax[c]+=v;
	nw+=1ll*tax[c]*(tax[c]-1)/2ll;
}
inline LL calc(int l,int r) {
	while(R<r)add(a[++R],1);
	while(L>l)add(a[--L],1);
	while(R>r)add(a[R--],-1);
	while(L<l)add(a[L++],-1);
	return nw;
}
void solve(int l,int r,int x,int y) {
	if(l>r) return;
	int mid=l+r>>1;dp[mid]=1e18;int id=0;
	for(re int i=x;i<=y&&i<mid;i++) {
		LL k=g[i]+calc(i+1,mid);
		if(k<dp[mid]) dp[mid]=k,id=i;
	}
	if(l==r) return;
	solve(l,mid-1,x,id);solve(mid+1,r,id,y);
}
int main() {
	n=read(),m=read()-1;
	for(re int i=1;i<=n;i++) a[i]=read();
	L=R=1;tax[a[1]]=1;
	for(re int i=1;i<=n;i++) dp[i]=calc(1,i);
	while(m--) {
		for(re int i=1;i<=n;i++)g[i]=dp[i];
		solve(1,n,1,n);
	}
	printf("%lld\n",dp[n]);
	return 0;
}

二、二分单调栈

主要用于优化\(dp_i=\max_{j<i}dp_j+w_{j+1,i}\)类的转移，是一种更为广义的斜率优化

一道例题[JSOI2011]柠檬

首先观察到我们划分出来的区间首尾肯定是同色的，而且首尾的颜色就是我们选择的颜色；如果首位不是我们所选择的颜色，我们完全可以选一个更小的区间使得贡献不变。

于是可以写出这样的方程\(dp_{i}=\max_{j\leq i,a_j=a_i}dp_{j-1}+a_i(s_i-s_j+1)^2\)，其中\(s_i=\sum_{j=1}^i[a_j=a_i]\)

我们思考一下其中的决策单调性，对于\(i\)这个位置，如果存在\(j,k,j<k\)这样的两个转移，这个时候\(j\)转移已经要优于\(k\)转移了，那么对于比\(i\)更大的位置，\(j\)转移还是要优于\(k\)，因为\(j\)的增长速度要快于\(k\)

于是我们可以维护一个存储决策点的栈，设\(f(j,k)\)表示决策\(j\)最早在什么时候好于决策\(k\)，这个可以在一个\(\log\)时间内二分求出，那么这个栈中任意三个连续元素\(j,k,l\)肯定会满足\(f(j,k)>f(k,l)\)；否则\(k\)这个决策点就太没用了，在\(k\)比\(l\)优的时候已经有一个比\(k\)更优的了，这样\(k\)永远也不会是最优决策了，对于这样的\(k\)我们不应该留在栈中

于是这道题我们对于每一种颜色维护一个单调栈就好了，复杂度\(O(n\log n)\)

#include<bits/stdc++.h>
#define re register
#define LL long long
#define lst(x) stk[x][stk[x].size()-1]
#define Lst(x) stk[x][stk[x].size()-2]
inline int read() {
	char c=getchar();int x=0;while(c<'0'||c>'9')c=getchar();
	while(c>='0'&&c<='9')x=(x<<3)+(x<<1)+c-48,c=getchar();return x;
}
const int maxn=1e5+5;
int a[maxn],p[maxn],tax[10005],n;
LL dp[maxn];
std::vector<int> stk[10005];
inline LL trans(int x,int c) {
	return dp[x-1]+1ll*(c-p[x]+1)*(c-p[x]+1)*a[x];
}
inline int chk(int a,int b) {
    int l=p[a]>p[b]?p[a]:p[b],r=n,nw=n+1;
	while(l<=r) {
		int mid=l+r>>1;
		if(trans(a,mid)>=trans(b,mid)) r=mid-1,nw=mid;else l=mid+1;
	}
	return nw;
}
int main() {
	n=read();for(re int i=1;i<=n;i++)a[i]=read(),p[i]=++tax[a[i]];
	for(re int i=1;i<=n;i++) {
		re int c=a[i];
		while(stk[c].size()>=2&&chk(Lst(c),lst(c))<=chk(lst(c),i)) stk[c].pop_back();
                //维护单调栈的性质
		stk[c].push_back(i);
		while(stk[c].size()>=2&&chk(Lst(c),lst(c))<=p[i]) stk[c].pop_back();
                //如果栈尾在当前不是最优的，那么在以后肯定也不是，于是弹栈
		dp[i]=trans(lst(c),p[i]);
	}
	printf("%lld\n",dp[n]);return 0;
}

posted @ 2020-01-04 14:59 asuldb 阅读(175) 评论(1) 编辑收藏举报

刷新页面返回顶部

Tommy_clas

Ведь от тайги до британских морей，Красная Армия всех сильней !

决策单调性胡扯笔记

一、分治

二、二分单调栈

公告