dp的四边形不等式优化

先来看一道题目:

\(n\) 堆石子排成一行,第 \(i\) 堆有 \(a_i\) 个石子每次选择相邻的两堆石子,将其合并为一堆,记录该次合并的得分为两堆石子个数之和。已知每堆石子的石子个数,求当所有石子合并为一堆时,最小的总得分。

区间DP模板题。设 \(dp(i,j)\) 为区间 \([i,j]\) 的最小得分,则状态转移方程为:

\[dp(i,j) = \min_{k=i}^{j-1}\{dp(i,k)+dp(k+1,j)+\sum_{s=i}^j a_s\} \]

code:

#include<bits/stdc++.h>
using namespace std;
const int inf=1<<30;
int dp[1005][1005],a[1005],sum[1005]; //sum[]数组为a[]数组的前缀和,这样就能快速求出∑a_s(i<=s<=j)。
int main()
{
	int n,i,j,k,s;
	scanf("%d",&n);
	for(i=1;i<=n;i++) dp[i][i]=0;
	sum[0]=0; 
	for(i=1;i<=n;i++)
	{
		scanf("%d",&a[i]);
		sum[i]=sum[i-1]+a[i];
	}
	for(k=1;k<n;k++)
	{
		for(i=1;i<=n-k;i++)
		{
			j=i+k;
			dp[i][j]=inf;
			for(s=i;s<j;s++) 
				dp[i][j]=min(dp[i][j],dp[i][s]+dp[s+1][j]+sum[j]-sum[i-1]);
		}
	}
	printf("%d\n",dp[1][n]);
	return 0;
}

容易看出,上面的代码时间复杂度为 \(O(n^3)\),数据一旦大一点,就会导致 TLE。

怎么办呢?我们来看代码的循环部分:

for(k=1;k<n;k++)
{
	for(i=1;i<=n-k;i++)
	{
		j=i+k;
		dp[i][j]=inf;
		for(s=i;s<j;s++) 
			dp[i][j]=min(dp[i][j],dp[i][s]+dp[s+1][j]+sum[j]-sum[i-1]);
	}
}

前两层循环枚举距离和起点,无法优化,但是第三层循环寻找断点是可以优化的。怎么做呢?

可以再开一个 \(s\) 数组来记录每个区间的最优断点,然后变量 \(k\) (寻找断点)每次只从 \(s(i,j-1)\) 循环到 \(s(i+1,j)\),这样时间复杂度可以从 \(O(n^3)\) 降到近似 \(O(n^2)\)

如何证明这样的循环来找断点是对的呢?

见下:(Edited by charliezhi2007

DP的平行四边形不等式证明,m[i][j]即为dp[i][j],s[i][j]表示i~j的最优化断点。

设a , b , c , d(a<=b<=c<=d)    //结论是两边之和大于第三边(四边形)
m(a,c) + m(b,d) <= m(a,d) + m(b,c)    //四边形对边相等
s[ i ][j-1] <= s[ i ][ j ] <= s[i+1][ j ]

s[ i ][ j ]<=s[i+1][ j ]思考
d=s[ i ][ j ] ,i < i + 1 <= k < d      k<-[ i , j ]        //设d为断点位置,假设k小于d,k为i,j中任意断点                           
mk(i,j) = m(i,k) + m(k + 1,j) + sum(i,j) //表示以k为断点i,j合并的代价   sum是i到j所有值得和
md(i,j) = m(i,d) + m(d + 1,j) + sum(i,j)    //表示以d为断点i,j合并的代价(代价最小)
mk(i,j) >= md(i,j) > 0           //d为断点将i,j合并的代价最小因为d是最优断点     
=> mk(i,j) - md(i,j) > 0                            

(mk(i + 1,j) - md(i + 1,j)) - (mk(i,j) - md(i,j))         //判断k>d 或 d>k因为上面假设k<d要证明
=(mk(i + 1,j) + md(i,j)) - (md(i + 1,j) + mk(i,j))     //将系数为负数的项,系数为正数的项放在一起
=    (m(i + 1,k) + m(k + 1,j) + m(i,d) + m(d + 1,j) + sum(i,j) + sum(i + 1,j))
    - (m(i + 1,d) + m(k + 1,j) + m(i,k) + m(k + 1,j)+ sum(i,j) + sum(i + 1,j))      //将式子展开
=>将减号两边的m(k + 1,j) 和 m(d + 1,j) 和 sum(i,j) 和 sum(i + 1,j)相互消元
=(m(i + 1,k) + m(i,d)) - (m(i + 1,d) + m(i,k))
=> i<i + 1<k <d       =       a <b <c <d            //两式变量相等
=>(m(i + 1,k) + m(i,d)) - (m(i + 1,d) + m(i,k))     =     (m(b,c) + m(a,d)) - (m(b,d) + m(a,c))     >0      //因ad+bc>=ac+bd所以该式大于0
=>(mk(i + 1,j) - md(i + 1,j)) - (mk(i,j) - md(i,j)) >0            //则这个也大于0
因d<=b    则b=s[i + 1][ j ]

下面求s[ i ][j-1]的思路于上面一致,则最终得出k∈[s[ i ][j-1] , s[i-1][ j ]]。

通过上述推论,可得出 \(s(i,j-1)\leq s(i,j)\leq s(i+1,j)\),再经过一波分析,可得出 \(s(i+1,j)-s(i,j-1)\) 小到几乎可以忽略不计,所以上述程序的复杂度降到了 \(O(n^2)\)

献上丑陋AC代码:

#include<bits/stdc++.h>
using namespace std;
const int inf=1<<30;
int dp[1005][1005],a[1005],sum[1005],s[1005][1005];
int main()
{
	int n,i,j,k,ss;
	scanf("%d",&n);
	for(i=1;i<=n;i++) 
	{
		dp[i][i]=0;
		s[i][i]=i;
	}
	sum[0]=0; 
	for(i=1;i<=n;i++)
	{
		scanf("%d",&a[i]);
		sum[i]=sum[i-1]+a[i];
	}
	for(k=1;k<n;k++)
	{
		for(i=1;i<=n-k;i++)
		{
			j=i+k;
			dp[i][j]=inf;
			for(ss=s[i][j-1];ss<=s[i+1][j];ss++) 
			{
				if(dp[i][ss]+dp[ss+1][j]+sum[j]-sum[i-1]<dp[i][j])
				{
					dp[i][j]=dp[i][ss]+dp[ss+1][j]+sum[j]-sum[i-1];
					s[i][j]=ss;
				}
			}
		}
	}
	printf("%d\n",dp[1][n]);
	return 0;
}
posted @ 2019-11-04 14:41  zzt1208  阅读(214)  评论(0编辑  收藏  举报