循序渐进动态规划

前言

这一强大的算法却有一个不相关的名字，常常引起混淆。实际上创造者Richard Bellman把这名字作为保护伞来掩人耳目的，从此延续下来。说它强大是因为应用范围很广，在优化算法中，在图像融合中，在很多实际问题中都有其身影。还因为使用它往往能收到奇效，当你尝试了分治，尝试了贪心仍然不能满意的时候也许动态规划才是最好的选择。这么好的方法想从心所欲并非易事，甚至很多时候无从下手。像动态规划算法本身所做的那样，我们把大事化小，小事化了，循序渐进的掌握它。

动态规划三部曲

大问题分解成子问题
从子问题分析状态和状态转移方程
自底向上的实现

和分治一样的地方是把大的化小，不一样的是在动态规划中小问题与原问题的本质相同，并且小问题的规模减少的不多，不是分治期望的一半。这样一来如果应用分治算法会大量的计算重复子问题导致十分缓慢，在动态规划中把这些小问题的结果存储下来不断的调用，这也是为什么要自底向上实现的原因。难就难在了第二部分，怎样分析出状态和状态转移方程，让我们结合具体的例子来理解。

动态规划4例

1.凑硬币 说我们有面值为1,3,5的硬币若干，问凑够11元所需最少硬币数。

三部曲之一，大化小。假如把凑够11元看成一个大问题，那么小问题是什么？凑够10元？9元？。。。或者说凑够i元。小问题浮出水面，凑够i元所需最少硬币就是原问题的子问题，这一子问题与原问题是同质的。换一个角度来看，如果这个子问题你解决了，那么原问题或者和原问题相当的问题你都解决了，说白了你解决的是一类问题。什么凑够888元，999元都不在话下。

三部曲之二，由子问题到状态和状态转移方程。状态就是子问题的数学表达，借助于数学符号易于发现其中规律。d[i]=j，表示凑够i元最少需要j个硬币。那么好了，从最简单的情况开始，通过归纳和对比看看能不能找出什么规律来。d[0]=?，换句话说凑够0最少需要多少硬币，当然是0个了，所以d[0]=0。也不难发现d[1]=d[1-1]+1=1，d[2]=d[2-1]+1=2。d[3]的时候就有所不同了，当然我们都知道d[3]=1，就是凑够3最少需要1个硬币。那么这个1是怎么来的？放慢思维会发现，首先试图用面值1元的需要3个，然后用面值3元的需要1个，面值5元的我们智慧大脑果断放弃了。在照顾到所有情况以后，得到结果d[3]=min(d[3-1]+1,d[3-3]+1)=1。把d[0]，d[1]，d[2]，d[3]写成更一般的形式d[i]=min(d[i-v[j]]+1)，i>v[j]（j表示第j个硬币，v[j]表示第j个硬币的面值）。d[i]=min(d[i-v[j]]+1)，i>v[j]就是状态转移方程，描述状态之间的转化关系。

三部曲之三，自底向下实现，有了状态和状态转移方程实现顺其自然，需要留意的地方是初始状态，它是已知的，通常是0或者无穷大，或者无穷小。

/**凑硬币
输入：现有面值1,3,5,7 的硬币若干
输出：如何用最少的硬币凑够S元，比如说11元。
状态：d[i]表示凑够i所用的最少硬币
状态转移方程：d[i] =min(d[i-v[j]]+1), v[j]<=i (v[j]表示第j个硬币的面值)
*/
void  coin_assmbling()
{
    const int Money = 11;
    vector<int> value = {1,3,5,7};
    vector<int> d(Money + 1, Infinity);
    d[0] = 0;
    for (int i = 1; i < Money + 1; ++i)
    for (int j = 0; j < value.size();++j)
    {
        if (value[j] <= i && d[i] > d[i - value[j]] + 1)
        {
            d[i] = d[i - value[j]] + 1;
        }
    }
    cout << "min coin num: " << d[Money] << endl;
}

2.最长非降子序列的长度 [5，3，4，8，6，7]的最长非降子序列是3，4，6，7长度是4

还是原来的步骤，还是原来的方法。子问题？[5，3，4，8，6]是原序列的子序列，[5，3，4，8]也是。那么用A[i]表示以第i个元素结尾的序列，A[i]的最长非降子序列就是原问题的一个子问题。求出所有A[i]的最长非降子序列，其中最最长的就是最终的结果。用d[i]表示以第i个元素结尾的最长非降子序列，从易到难。

前一个数的LIS：d[1]=1（序列5）
前两个数的LIS：d[2]=1（序列5，3，3前面没有比3小的）
前三个数的LIS：d[3]=2（序列5，3，4；4前有3所以d[3]=d[2]+1）
前4个数的LIS：d[4]=3（序列5，3，4，8；d[4]=max(d[1],d[2],d[3]+1)）

有上面分析得到状态转移方程d[i]=max(1，d[j]+1) j<i，a[j]<=a[i]。文字表述就是把i前面的各个子序列中，最后一个不大于a[i]的数加1，其中的最大值就是所求。当然有可能每个子序列都大于a[i]，比如[5，4，3，2，1]的最长非降子序列是1。

/**最长非降子序列（LIS）
输入：数组 a
输出：最长非降子序列的长度及其内容
状态：d[i]表示以a[i]结尾的最长非降子序列的长度
状态转移方程：d[i]={max(1,d[j+1]), j<i a[j]<=a[i]}
*/
void longest_increasing_subsequence()
{
    vector<int> a = { -2, 11, -4, 13, -5, -2 };
    vector<int> d(a.size(), 1);
    d[0] = 1;
    int max = d[0];
    int max_id = 0;
    for (int i = 1; i < a.size();++i)
    {
        for (int j = 0; j < i;++j)
        {
            if (a[j] <= a[i] && d[i] < d[j] + 1)
                d[i] = d[j] + 1;
        }
        if (max < d[i])
        {
            max = d[i];
            max_id = i;
        }
    }
    // print max length 
    cout << "max length is: " << max << endl;
    // print subsequence element
    cout << "they are: " << endl;
    cout << a[max_id] << "\t";
    int temp = max;
    for (int i = max_id-1; i >= 0;--i)
    {
        if (d[i] == temp - 1)
        {
            cout << a[i] << "\t";
            temp -= 1;
        }
    }
    cout << endl;
}

3.最长公共子序列 比如度量两个DNA序列的相似程度。

这比上面的例子更复杂，它是2维的动态规划问题。因为需要两个变量来刻画状态。还是先找出子问题。考虑到两个序列的子序列可以分别表示成A[i]和B[j]，自然联想d[i][j]表示以i结尾的序列A[i]和以j结尾的序列B[j]他们最长公共子序列的长度。考虑d[i][j]和它前面状态d[i-1][j]，d[i][j-1]，d[i-1][j-1]之间的关系。容易得到状态转移方程

d[i][j]={0，i==0||j==0; d[i-1][j-1]+1，a[i]==b[j]; max(d[i-1][j],d[i][j-1])，a[]!=b[j];}

/**最长公共子序列（LCS）
输入：两个数组 a b
输出：求他们的最长公共子序列
分析：1.首先把大问题变成小问题，把原问题转化成求两个不完全数组的公共子序列，求以分别以a[i]和b[j]结尾的子数组的最长公共子序列。
        2.从子问题分析状态，s[i][j]表示a[i] b[j]结尾的子数组的最长公共子序列。进一步分析前一状态和后一状态之间的关系。  
状态：s[i][j]
状态转移方程：d[i][j]={0 i==0|| j==0; d[i-1][j-1]+1 a[i]==b[j]; max(d[i-1][j],d[i][j-1], a[i]!=b[j]);}
*/
void longest_common_subsequence()
{
    const string a = { 'A', 'B', 'C', 'B', 'D', 'A', 'B' };
    const string b = { 'B', 'D', 'C', 'B', 'A' };

    vector<vector<int>> d(a.size()+1);
    for (auto& e:d)
    {
        e.resize(b.size()+1);
    }
    vector<vector<int>> table(d);

    for (int i =0 ; i < a.size();++i)
    {
        for (int j = 0; j < b.size();++j)
        {
            if (a[i] == b[j])
            {
                d[i + 1][j + 1] = d[i][j]+1;
                table[i + 1][j + 1] = 0;
            }
            else if (d[i][j + 1]>d[i + 1][j])
            {
                d[i + 1][j + 1] = d[i][j + 1];
                table[i + 1][j + 1] = 1;

            }
            else
            {
                d[i + 1][j + 1] = d[i+1][j];
                table[i + 1][j + 1] = 2;
            }
        }
    }
    cout << "longest common subsequence: " << d[a.size()][b.size()]<<endl;
    cout << "they are: " << endl;
    int r = a.size();
    int c = b.size();

    for (int i = a.size()-1; i>=0; --i)
    {
        if (table[r][c] == 0)
        {
            cout << a[r - 1] << "\t";
            r -= 1;
            c -= 1;
        }
        else if (table[r][c] == 1)
        {
            r -= 1;
        }
        else
        {
            c -= 1;
        }
    }
    cout << endl;
}

4.0-1背包问题

/**0-1背包
输入：一个容量V的背包，若干宝石，价值体积各不同。
输出：可能装入宝石的最大价值
分析：这是一种有限制条件的动态规划问题，因此通常需要一个额外的状态来刻画限制条件。
        1.首先把大问题转化成小问题，假设s[i]代表加入前个宝石能达到的最大价值。这并没有体现背包容量的限制。
        因此使用s[i][j]表示把前i个宝石装入到剩余体积j的背包中能达到的最大价值。
        2.由状态分析状态转移方程，思考d[i][j]与d[i-1]的关系。显然两种情况，既是装入和不装入第i件物品。
状态：d[i][j]把前i个宝石装入到剩余体积j的背包里能达到的最大价值
状态转移方程：d[i][j]=max(d[i-1][j-vo[i]]+va[i], d[i-1][j])
*/
void knapsack()
{
    const int V = 12;
    vector<int> value = { 10, 9, 6, 1, 4, 9, 20, 6, 20, 4 };
    vector<int> volume = { 5, 4, 3, 5, 2, 6, 4, 4, 3, 4 };
    vector<vector<int>> d(value.size()+1);
    for (auto& e:d)
    {
        e.resize(V+1);
    }

    int j = V;
    for (int i = 0; i < value.size();++i)
    {
        for (int j = 0; j < V; ++j)
        {
            d[i + 1][j + 1] = d[i][j + 1];
            if (j>=volume[i] && d[i + 1][j + 1] < d[i][j + 1 - volume[i]] + value[i])
                d[i + 1][j + 1] = d[i][j + 1 - volume[i]] + value[i];
        }
    }

    cout << "max value: " << d[value.size()][V] << endl;
    cout << "they are: " << endl;

    //vector<int> table(value.size());
    j = V;
    for (int i = value.size()-1; i >= 0; --i)
    {
        if (d[i + 1][j] > d[i][j])
        {
            cout << value[i] << "\t";
            j -= volume[i];
        }
    }
    cout << endl;
}

参考

http://hawstein.com/posts/dp-novice-to-advanced.html

http://blog.csdn.net/zmazon/article/details/8247015

posted @ 2014-08-05 11:13 tpys 阅读(498) 评论(0) 收藏举报

刷新页面返回顶部

tpys

循序渐进动态规划

公告