Lintcode--007(不同的子序列)
题目:http://www.lintcode.com/zh-cn/problem/distinct-subsequences/
2016-08-25
给出字符串S和字符串T,计算S的不同的子序列中T出现的个数。
子序列字符串是原始字符串通过删除一些(或零个)产生的一个新的字符串,并且对剩下的字符的相对位置没有影响。(比如,“ACE”是“ABCDE”的子序列字符串,而“AEC”不是)。
给出S = "rabbbit", T = "rabbit"
返回 3.
解题:
分析:
一般来说,如果题目里面给出两个字符串,基本是两种思路,一种就是递归判断,一种就是动态规划。这里我们可以用 f[i,j] 表示S中前i个字符串中,T的前j个字符出现的次数。
比较 S[i-1] 是否等于 T[j-1]:
(1)如果不相等: f[i,j] = f[i-1,j] ;
(2)如果相等:f[i,j] = f[i-1,j]+f[i-1,j-1];
可以看到,i的状态只与i-1有关,于是可以用滚动数组来进行优化。
总结:像这类动态规划题目,都是设法找到子问题的解,然后进行归纳递推。具体的,比如5,6,7三个题目。
a. 先设置一个子问题:前i个字符组成的字符串,和前j个字符组成的字符串,它的解为p[i][j];
b. 然后考虑这个解与p[i-1,j-1],p[i,j-1],p[i-1,j] 的关系。一般就是通过比较前最后两个字符是否相等来归纳,写出问题解的表达式。
c. 求出初始值,剩下的计算,交给计算机好了。
代码如下:
class Solution { public: /** * @param S, T: Two string. * @return: Count the number of distinct subsequences */ int numDistinct(string &S, string &T) { // write your code here //动态规划问题,主要还是熟悉动态规划的解题模式。 //注意初始值设置要正确,边界要完整。 int Slen=S.length(); int Tlen=T.length(); int dp[Slen+1][Tlen+1]; dp[0][0]=1; for(int i=1;i<Slen+1;i++){ dp[i][0]=1; } for(int j=1;j<Tlen+1;j++){ dp[0][j]=0; } for(int i=0;i<Slen;i++){ for(int j=0;j<Tlen;j++){ if(S[i]!=T[j]){ dp[i+1][j+1]=dp[i][j+1]; } else{ dp[i+1][j+1]=dp[i][j]+dp[i][j+1]; } } } return dp[Slen][Tlen]; } };
附:优化代码
转自:http://blog.csdn.net/wangyuquanliuli/article/details/45830879
class Solution { public: /** * @param S, T: Two string. * @return: Count the number of distinct subsequences */ int numDistinct(string &S, string &T) { // write your code here vector<int> dp(T.length()+1); dp[0] = 1; for(int i=1;i<=S.length();i++) { for(int j=T.length();j>0;j--) dp[j] += T[j-1]==S[i-1]?dp[j-1]:0; } return dp[T.length()]; } };
滚动数组:
转自:http://blog.csdn.net/niushuai666/article/details/6677982
滚动数组的作用在于优化空间,主要应用在递推或动态规划中(如01背包问题)。因为DP(动态规划)题目是一个自底向上的扩展过程,我们常常需要用到的是连续的解,前面的解往往可以舍去。所以用滚动数组优化是很有效的。利用滚动数组的话在N很大的情况下可以达到压缩存储的作用。
一个简单的例子:
斐波那契数列:
一般代码:
#include<iostream> #include<cstdio> using namespace std; int Fib[25]; int fib(int n) { Fib[0] = 0; Fib[1] = 1; Fib[2] = 1; for(int i = 3; i <= n; ++i) Fib[i] = Fib[i - 1] + Fib[i - 2]; return Fib[n]; } int main() { int ncase, n, ans; scanf("%d", &ncase); while(ncase--) { scanf("%d", &n); ans = fib(n); printf("%d\n", ans); } return 0; }
利用滚动数组优化后代码为:
大家熟悉的斐波那契数列,f(n) =f(n-1) +f(n-2),如果要求解f(1000),是不需要申请1000个大小的数组的,使用滚动数组只需申请3个空间f[3]就可以完成任务。
#include<cstdio> using namespace std; int Fib[3]; int fib(int n) { Fib[1] = 0; Fib[2] = 1; for(int i = 2; i <= n; ++i) {//这里实现滚动; Fib[0] = Fib[1]; Fib[1] = Fib[2]; Fib[2] = Fib[0] + Fib[1]; } return Fib[2]; } int main() { int ncase, n, ans; scanf("%d", &ncase); while(ncase--) { scanf("%d", &n); ans = fib(n); printf("%d\n", ans); } return 0; }
所谓滚动数组,目的在于优化空间,状态转移矩阵使用的是一个N*V的数组,在求解的过程中,我们可以发现,当前状态只与前一状态 的解有关,那么之前存储的状态信息已经无用了,可以舍弃的,我们只需要空间存储当前的状态和前一状态,所以只需使用2*V的空间,循环滚动使用,就可以达 到跟N*V一样的效果。这是一个非常大的空间优化。
滚动数组实际是一种节省空间的办法,时间上没啥优势,多用于DP中,举个例子吧:
一个DP,平常如果需要1000×1000的空间,其实根据DP的无后效性,可以开成2×1000,然后通过滚动,获得和1000×1000一样的效果。 滚动数组常用于DP之中,在DP过程中,我们在由一个状态转向另一个状态时,很可能之前存储的某些状态信息就已经无用了,例如在01背包问题中,从理解角 度讲我们应开DP[i][j]的二维数组,第一维我们存处理到第几个物品,也就是阶段了,第二维存储容量,但是我们获得DP[i],只需使用DP[i - 1]的信息,DP[i - k],k>1都成了无用空间,因此我们可以将数组开成一维就行,迭代更新数组中内容,滚动数组也是这个原理,目的也一样,不过这时候的问题常常是不 可能缩成一维的了,比如一个DP[i][j]需要由DP[i - 1 ][k],DP[i - 2][k]决定,i<n,0<k<=10;n <= 100000000;显然缩不成一维,正常我们应该开一个DP[100000005][11]的数组,结果很明显,超内存,其实我们只要开DP[3] [11]就够了DP[i%3][j]由DP[(i - 1)%3][k]和DP[(i - 2)%3][k]决定,空间复杂度差别巨大。