(C/C++学习)33.编辑距离和正则表达式匹配分析
说明:本文主要分析关于力扣 10 题(正则表达式匹配) 和 力扣 72 题(编辑距离) 的状态方程问题(主要便于自己理解)
1.关于编辑距离的状态方程:
a. 首先 DP[i][j] 为字符串 1 的前 i 个字符和字符串 2 的前 j 个字符能匹配的最小步数;
b. 其次根据字符串编辑操作:增添、删除以及替换,列出以下状态方程:
1 DP[i][j] = DP[i-1][j-1]+1 //替换元素 2 DP[i][j] = DP[i][j-1]+1 //从索引为 i 的字符串插入一个元素或从索引为 j 的字符串2中删除一个元素 3 DP[i][j] = DP[i-1][j]+1 //从索引为 i 的字符串删除一个元素或从索引为 j 的字符串2中插入一个元素
注意:其实在编辑距离问题中, 为了达到匹配,一个字符串的元素插入可以用另一个字符串的元素删除来达到同样的目的。
如 ab -> abc, 可以前者插入 c,也可以后者删除 c,这就是为什么代码中2、3行可以有两层含义的原因。另外,理解状态方
程正向较难,可以逆向理解。
1.关于正则表达式匹配的状态方程:
a. 首先 DP[i][j] 为字符串 1 的前 i 个字符和字符串 2 的前 j 个字符是否能匹配(true 或 false);
b. 其次根据匹配规则,列出以下状态方程:
若: s[i-1] = p[j-1] 或 p[j-1] = '.' 那么:DP[i][j] = DP[i-1][j-1]
否则:① 若 P[j-1] = '*'
若: s[i-1] != p[j-2] 并且 p[j-2] != '.' 那么:DP[i][j] = DP[i][j-2]
否则:DP[i][j] = DP[i-1][j] //字符串 2 复制多个元素来匹配 (继续下一次复制,不跳过 “*”)
DP[i][j] = DP[i][j-1] //字符串 2 复制1个元素来匹配 (跳过 “*”)
DP[i][j] = DP[i][j-2] //字符串 2 不需要复制来匹配(直接跳过 “.*” 或 “字符*”)
② 空
注意:两个问题的初始化都应该特别小心