Lintcode--007(不同的子序列)

题目：http://www.lintcode.com/zh-cn/problem/distinct-subsequences/

2016-08-25

给出字符串S和字符串T，计算S的不同的子序列中T出现的个数。

子序列字符串是原始字符串通过删除一些(或零个)产生的一个新的字符串，并且对剩下的字符的相对位置没有影响。(比如，“ACE”是“ABCDE”的子序列字符串,而“AEC”不是)。

样例

给出S = "rabbbit", T = "rabbit"

返回 3.

标签

字符串处理动态规划

解题：

分析：

一般来说，如果题目里面给出两个字符串，基本是两种思路，一种就是递归判断，一种就是动态规划。这里我们可以用 f[i,j] 表示S中前i个字符串中，T的前j个字符出现的次数。

比较 S[i-1] 是否等于 T[j-1]:

(1)如果不相等: f[i,j] = f[i-1,j] ;

(2)如果相等：f[i,j] = f[i-1,j]+f[i-1,j-1];

可以看到，i的状态只与i-1有关，于是可以用滚动数组来进行优化。

总结：像这类动态规划题目，都是设法找到子问题的解，然后进行归纳递推。具体的，比如5,6,7三个题目。

a. 先设置一个子问题：前i个字符组成的字符串，和前j个字符组成的字符串，它的解为p[i][j]；

b. 然后考虑这个解与p[i-1,j-1],p[i,j-1],p[i-1,j] 的关系。一般就是通过比较前最后两个字符是否相等来归纳，写出问题解的表达式。

c. 求出初始值，剩下的计算，交给计算机好了。

代码如下：

class Solution {
public:    
    /**
     * @param S, T: Two string.
     * @return: Count the number of distinct subsequences
     */
    int numDistinct(string &S, string &T) {
        // write your code here
        //动态规划问题,主要还是熟悉动态规划的解题模式。
        //注意初始值设置要正确,边界要完整。
        
        int Slen=S.length();
        int Tlen=T.length();
        int dp[Slen+1][Tlen+1];
        
        dp[0][0]=1;
        for(int i=1;i<Slen+1;i++){
            dp[i][0]=1;
        }
        for(int j=1;j<Tlen+1;j++){
            dp[0][j]=0;
        }
        for(int i=0;i<Slen;i++){
            for(int j=0;j<Tlen;j++){
                if(S[i]!=T[j]){
                    dp[i+1][j+1]=dp[i][j+1];
                }
                else{
                    dp[i+1][j+1]=dp[i][j]+dp[i][j+1];
                }
            }
        }
        return dp[Slen][Tlen];
    }
};

附：优化代码

转自：http://blog.csdn.net/wangyuquanliuli/article/details/45830879

    class Solution {  
    public:      
        /** 
         * @param S, T: Two string. 
         * @return: Count the number of distinct subsequences 
         */  
        int numDistinct(string &S, string &T) {  
            // write your code here  
            vector<int> dp(T.length()+1);  
            dp[0] = 1;  
            for(int i=1;i<=S.length();i++)  
            {  
                for(int j=T.length();j>0;j--)  
                    dp[j] += T[j-1]==S[i-1]?dp[j-1]:0;  
            }  
            return dp[T.length()];  
        }  
    };

滚动数组：

转自：http://blog.csdn.net/niushuai666/article/details/6677982

滚动数组的作用在于优化空间，主要应用在递推或动态规划中（如01背包问题）。因为DP（动态规划）题目是一个自底向上的扩展过程，我们常常需要用到的是连续的解，前面的解往往可以舍去。所以用滚动数组优化是很有效的。利用滚动数组的话在N很大的情况下可以达到压缩存储的作用。

一个简单的例子：

斐波那契数列：

一般代码：

#include<iostream>
#include<cstdio>
using namespace std;
int Fib[25];

int fib(int n)
{
    Fib[0] = 0;
    Fib[1] = 1;
    Fib[2] = 1;
    for(int i = 3; i <= n; ++i)
        Fib[i] = Fib[i - 1] + Fib[i - 2];
    return Fib[n];
}

int main()
{
    int ncase, n, ans;
    scanf("%d", &ncase);
    while(ncase--)
    {
        scanf("%d", &n);
        ans = fib(n);
        printf("%d\n", ans);
    }
    return 0;
}

利用滚动数组优化后代码为：

大家熟悉的斐波那契数列，f(n) =f(n-1) +f(n-2)，如果要求解f(1000)，是不需要申请1000个大小的数组的，使用滚动数组只需申请3个空间f[3]就可以完成任务。

 
#include<cstdio>
using namespace std;
int Fib[3];

int fib(int n)
{
    Fib[1] = 0; 
    Fib[2] = 1;
    for(int i = 2; i <= n; ++i)
    {//这里实现滚动；
        Fib[0] = Fib[1]; 
        Fib[1] = Fib[2];
        Fib[2] = Fib[0] + Fib[1];
    }
    return Fib[2];
}

int main()
{
    int ncase, n, ans;
    scanf("%d", &ncase);
    while(ncase--)
    {
        scanf("%d", &n);
        ans = fib(n);
        printf("%d\n", ans);
    }
    return 0;
}

所谓滚动数组，目的在于优化空间，状态转移矩阵使用的是一个N*V的数组，在求解的过程中，我们可以发现，当前状态只与前一状态的解有关，那么之前存储的状态信息已经无用了，可以舍弃的，我们只需要空间存储当前的状态和前一状态，所以只需使用2*V的空间，循环滚动使用，就可以达到跟N*V一样的效果。这是一个非常大的空间优化。

滚动数组实际是一种节省空间的办法，时间上没啥优势，多用于DP中，举个例子吧：

一个DP，平常如果需要1000×1000的空间，其实根据DP的无后效性，可以开成2×1000，然后通过滚动，获得和1000×1000一样的效果。滚动数组常用于DP之中，在DP过程中，我们在由一个状态转向另一个状态时，很可能之前存储的某些状态信息就已经无用了，例如在01背包问题中，从理解角度讲我们应开DP[i][j]的二维数组，第一维我们存处理到第几个物品，也就是阶段了，第二维存储容量，但是我们获得DP[i],只需使用DP[i - 1]的信息，DP[i - k],k>1都成了无用空间，因此我们可以将数组开成一维就行，迭代更新数组中内容，滚动数组也是这个原理，目的也一样，不过这时候的问题常常是不可能缩成一维的了，比如一个DP[i][j]需要由DP[i - 1 ][k],DP[i - 2][k]决定，i<n，0<k<=10;n <= 100000000;显然缩不成一维,正常我们应该开一个DP[100000005][11]的数组，结果很明显，超内存，其实我们只要开DP[3] [11]就够了DP[i%3][j]由DP[(i - 1)%3][k]和DP[(i - 2)%3][k]决定，空间复杂度差别巨大。

posted @ 2016-08-25 17:07 静悟生慧阅读(212) 评论(0) 收藏举报

刷新页面返回顶部

静悟生慧

Lintcode--007(不同的子序列)

公告