002-公共子串计算
一 题目相关
1 题目描述
给定两个只包含小写字母的字符串,计算两个字符串的最大公共子串的长度。
注:子串的定义指一个字符串删掉其部分前缀和后缀(也可以不删)后形成的字符串。
2 输入描述: 输入两个只包含小写字母的字符串
3 输出描述:输出一个整数,代表最大公共子串的长度
4 示例:
- 输入:asdfas
- werasdfaswer
- 输出:6
二 解题思路
思路一:通过字符串切片实现——暴力查找法
1 思路:
- n表示公共子串的长度,初始值为0;
- 从str1的第一个字符到最后一个字符开始,分别对str1进行切片,得到str1的各个切片子子串,然后判断各个子串是否在str2中,如果在,则n的值加一,如果不存在,则更新切片子子串的首字母,重新开始切片;
- 如果有一次切片过程持续到str1的最后一个字符,则结束查找,此时n的值就是str1和str2的最长公共子串的长度:
2 举例:
例如:str1 = abcdef , str2 = acdefgh
从str1的第一个字母开始切片:
i | str_1[i-n:i+1] | n |
0 | str_1[0,1]=a | 1 |
1 | str_1[0,1]=ab | 1 |
从str1的第二个字母开始切片:
i | str_1[i-n:i+1] | n |
2 | str_1[1,3]=bc | 1 |
从str1的第三个字母开始切片:
i | str_1[i-n:i+1] | n |
3 | str_1[2,4]=cd | 2 |
4 | str_1[2,5]=cde | 3 |
5 | str_1[2,6]=cdef | 4 |
思路二:通过动态规划实现——列出二维矩阵分析
1 思路
- 把两个字符串分别以行和列组成一个二维矩阵。
- 比较二维矩阵中每个点对应行列字符中否相等,相等的话值设置为1,否则设置为0。
- 通过查找出值为1的最长对角线就能找到最长公共子串。
2 举例
比如:str=acbcbcef,str2=abcbced,则str和str2的最长公共子串为bcbce,最长公共子串长度为5。
针对于上面的两个字符串我们可以得到的二维矩阵如下:
从上图可以看到,str1和str2共有5个公共子串,但最长的公共子串长度为5。
为了进一步优化算法的效率,我们可以再计算某个二维矩阵的值的时候顺便计算出来当前最长的公共子串的长度,即某个二维矩阵元素的值由record[i][j]=1演变为record[i][j]=1 +record[i-1][j-1],这样就避免了后续查找对角线长度的操作了。修改后的二维矩阵如下:
递推公式为:
- 当A[i] != B[j],dp[i][j] = 0
- 当A[i] == B[j],
- 若i == 0 || j == 0,dp[i][j] = 1
- 否则 dp[i][j] = dp[i - 1][j - 1] + 1
简化一下递推公式:
- 当A[i] != B[j],dp[i][j] = 0
- 否则 dp[i][j] = dp[i - 1][j - 1] + 1
- 全部都归结为一个公式即可,二维数组默认值为0
参考:https://www.cnblogs.com/fanguangdexiaoyuer/p/11281179.html
三 代码
思路一:
1 while True: 2 try: 3 str_1 = input().lower() 4 str_2 = input().lower() 5 n = 0 6 for i in range(len(str_1)): 7 if str_1[i-n:i+1] in str_2: 8 n += 1 9 print(n) 10 except: 11 break
思路二:
1 def LCstring(string1,string2): 2 len1 = len(string1) 3 len2 = len(string2) 4 res = [[0 for i in range(len1+1)] for j in range(len2+1)] 5 result = 0 6 for i in range(1,len2+1): 7 for j in range(1,len1+1): 8 if string2[i-1] == string1[j-1]: 9 res[i][j] = res[i-1][j-1]+1 10 result = max(result,res[i][j]) 11 return result 12 print(LCstring("helloworld","loop")) 13 # 输出结果为:2