01背包和动态规划

  做了一段时间NOI,做到动态规划看了几天算法书籍。还是没有深入,学了基本的动态规划,稍有一点体会,记录到这里。

  背包是这样一类问题:在限定总质量前提下,从若干质量\价格对中,取哪些能使得价格最大。

  动态规划是一种思想,简单的说,动态规划思想就是充分利用对子问题的计算结果来递推父问题结果。所以,动态规划具有较高的效率,省去了一些不必要的计算。这里主要关心表和递推关系,其实这两者是同一个东西,根据记录表来推得父问题的解,找到递推关系要依赖表记录子问题的解。不同的问题有不同的构建方式,所以我个人觉得,初学时没有必要看了理论然后直接去写代码,可以看一下其他人是如何写的代码。边调试代码边理解思路效率更高,但这还不是自己的东西,需要一定的练习。动态规划是一种思想,但解决不同类型(特点)的问题时有不同的突破口,这也导致即使都用动态规划不同问题的解决代码差异也较大,同样道理,相同类型的问题代码的框架结构是一样的,掌握一类问题的分析方法和编码框架都是必要的,两者相辅相成,就像我们要输出一个数组的全部元素,大家都会马上拿来for while这样的语句来用。

  现在来看背包问题是怎么利用记录表来高效解决问题的,这里有一组范例数据:

4 7
1 2
3 1
5 10
4 11

其中,第一行是质量\价格对个数和允许最大质量,记为n=4,w=7。后续4行前面是质量,后面是价格,可以用两个数组记录也可以用结构。显而易见,选择物品1和4可以达到价值13(质量5)。现在来看一下解决这个问题的记录表:

m w  oid 0  1  2  3  4  5  6  7
0 0 0 0 0 0 0 0 0
1 2 1 0 2 2 2 2 2 2 2 3 1 2 0 2 2 2 3 3 3 3 5 10 3 0 2 2 2 3 10 12 12 4 11 4 0 2 2 2 11 13 13 13

表是从左到右填写完一行再从左到右填写下一行。其中绿色的行是选择物品的范围最大下标oid(如oid=2表示从编号为1、2的两个物品中选择);而红色的行是当前允许最大质量curw——这就是动态规划解决背包问题的思路,从0容量背包开始,让后是1一直递推到最大背包容量;表内数据部分就是记录值——table[oid][curw]记录了在前oid个物品中取若干个装入curw大小的背包能装入的最大价值。所以,无论01背包、完全背包、部分背包或同类问题用动态规划都是一个代码框架(尤其是01和完全,代码就差2点点)。现在我们思考这样几个问题:

1、背包问题对于任何一个物品来讲,只有两种状态:取、不取。那么,这两种状态的编码怎么写?

其实这个问题相对比较简单,只要当前背包质量不达到当前物品质量,那就无需装入;达到了就尝试装入,即:

            if(curw<wArr[oid]){
              //不装入
            }else{
        //尝试装入
            }

2、如何尝试装入?

  还记得上面所说的curw大小的背包能装入的最大价值吗?这两者也是同一个问题,为了保证curw保存最大价值,我们需要尝试把当前物品放入背包。那么如何得到放入背包之前的最大价值呢?table[oid][curw-wArr[oid]]就是了,因为我们已经记录了从0到curw的任何一个质量的最大价值(这也是从curw从0遍历到maxw的原因,也是优化的突破口),所以这个值就是没有放入当前物品时的最大价值。不要担心curw-wArr[oid]的大小,我们讨论的就是curw>=wArr[oid]的情况。

  现在计算物品放入背包之后的价值:table[oid][curw-wArr[oid]]+vArr[oid]。这是一种尝试,通过尝试放入当前物品,我们知道放入之后的最大价值,但是这个价值不一定比不放的时候大。所以,现在我们需要在放入这个物品之后的价值table[oid][curw-wArr[oid]]+vArr[oid]和不尝试放入这个物品时的最大价值table[oid][curw]中找到最大的那个。那么把代码放在下面更便于浏览:

int dp()
{
    for(int oid=0;oid<n;oid++)
    {
        for(int curw=0;curw<=w;curw++)
        {
            if(curw<wArr[oid]){
                table[oid+1][curw]=table[oid][curw];
            }else{
                table[oid+1][curw]=max(table[oid][curw],table[oid][curw-wArr[oid]]+vArr[oid]);
            }
            printf("% 2d ",table[oid+1][curw]);
        }
        cout<<endl;
    }
    return table[n][w];
}

  根据上面的分析,显然需要从0容量背包开始递推,而取物品时会用到不取任何物品时的值(“拿走一部分那里”),所以内外循环这里都从0开始。当然,如果你修改代码不使用oid+1而直接使用oid,将会有一些不同。但无论如何,用于递推的基础数据——table表的一部分都需要初始化:

for(i=0;i<=n;i++) table[0][i]=0;

 

完整代码如下:

#include<iostream>  
#include<algorithm>  
using namespace std;  

int n,w;  
int wArr[100]={0};  
int vArr[100]={0};  
int table[100][100];  

int dp()
{
    for(int oid=0;oid<n;oid++)
    {
        for(int curw=0;curw<=w;curw++)
        {
            if(curw<wArr[oid]){
                table[oid+1][curw]=table[oid][curw];
            }else{
                table[oid+1][curw]=max(table[oid][curw],table[oid][curw-wArr[oid]]+vArr[oid]);
            }
            printf("% 2d ",table[oid+1][curw]);
        }
        cout<<endl;
    }
    return table[n][w];
}

int main()
{
    int i;
    cin>>n>>w;
    for(i=0;i<=n;i++) table[0][i]=0;
    for(i=0;i<n;i++) cin>>wArr[i]>>vArr[i];
    cout<<dp(); 
}

   可能对于table[oid][curw-wArr[oid]]的解释有人还不理解。现在,我们不从wArr[oid]质量的物体前的情况出发,我们来看空背包先放入wArr[oid]的物品之后还能放的物品的最大值:想象可容纳curw质量的背包有两个口袋,其中一个正好装入wArr[oid]质量。想象中,请稍候…………那么,整个背包能装的最大价值是多少取决于另一个口袋的能装的最大价值是多少。table[oid][curw-wArr[oid]]就是另一个口袋能装下的最大价值。

posted @ 2017-01-06 16:06  zcsor~流浪dè风  Views(270)  Comments(0Edit  收藏  举报