10. 正则表达式匹配
题目中的匹配是一个「逐步匹配」的过程:我们每次从字符串 p 中取出一个字符或者「字符 + 星号」的组合,并在 s 中进行匹配。对于 p 中一个字符而言,它只能在 s 中匹配一个字符,匹配的方法具有唯一性;而对于 p 中字符 + 星号的组合而言,它可以在 s 中匹配任意自然数个字符,并不具有唯一性。因此我们可以考虑使用动态规划,对匹配的方案进行枚举。
我们用 \(f[i][j]\) 表示 s 的前 \(i\) 个字符与 p 中的前 \(j\) 个字符是否能够匹配。在进行状态转移时,我们考虑 p 的第 \(j\) 个字符的匹配情况:
如果 p 的第 \(j\) 个字符是一个小写字母,那么我们必须在 s 中匹配一个相同的小写字母,即
\[f[i][j] = \begin{cases} f[i - 1][j - 1], & s[i] = p[j]\\ \text{false}, & s[i] \neq p[j] \end{cases}
\]
也就是说,如果 s 的第 \(i\) 个字符与 p 的第 \(j\) 个字符不相同,那么无法进行匹配;否则我们可以匹配两个字符串的最后一个字符,完整的匹配结果取决于两个字符串前面的部分。
如果 p 的第 \(j\)个字符是 *
,那么就表示我们可以对 p 的第 \(j-1\) 个字符匹配任意自然数次。在匹配 \(0\) 次的情况下,我们有
\[f[i][j]=f[i][j−2]
\]
也就是我们「浪费」了一个字符 + 星号的组合,没有匹配任何 s 中的字符。
在匹配 \(1,2,3, \cdots\) 次的情况下,类似地我们有
\[\begin{aligned} & f[i][j] = f[i - 1][j - 2], \quad && \text{if } s[i] = p[j - 1] \\ & f[i][j] = f[i - 2][j - 2], \quad && \text{if } s[i - 1] = s[i] = p[j - 1] \\ & f[i][j] = f[i - 3][j - 2], \quad && \text{if } s[i - 2] = s[i - 1] = s[i] = p[j - 1] \\ & \cdots\cdots & \end{aligned}
\]
总的转移方程如下:
\[f[i][j] \ |= \begin{cases}
f[i][j−2] \\
f[i - 1][j - 2] \And\And s[i] = p[j - 1] \\
f[i - 2][j - 2] \And\And s[i - 1] = s[i] = p[j - 1] \\
f[i - 3][j - 2] \And\And s[i - 2] = s[i - 1] = s[i] = p[j - 1] \\ \cdots\cdots
\end{cases}
\]
如果我们通过这种方法进行转移,那么我们就需要枚举这个组合到底匹配了 s 中的几个字符,会增导致时间复杂度增加。
用\(i - 1\)代替上式的\(i\)得到:
\[f[i-1][j] \ |= \begin{cases}
f[i-1][j−2] \\
f[i - 2][j - 2] \And\And s[i-1] = p[j - 1] \\
f[i - 3][j - 2] \And\And s[i - 2] = s[i - 1] = p[j - 1] \\ \cdots\cdots
\end{cases}
\]
于是转移方程可简化为:
\[f[i][j] \ |= \begin{cases}
f[i][j−2] \\
f[i - 1][j] \And\And s[i] = p[j - 1]
\end{cases}
\]
总的转移方程如下:
\[f[i][j] |= \begin{cases}
f[i - 1][j - 1] \And\And s[i] = p[j] & p[j] \ne '*' \\
f[i][j-2] \ || \ f[i-1][j] \And\And s[i] = p[j-1] & p[j] = '*'
\end{cases}
\]
注意点
第一层循环\(i\)下标从\(0\)开始,因为'*'可以匹配\(0\)个元素。
class Solution {
public:
bool isMatch(string s, string p) {
int n = s.size(), m = p.size();
s = ' ' + s, p = ' ' + p;
vector<vector<int>> f(n + 1, vector<int>(m + 1));
f[0][0] = true;
auto match = [&](int i, int j) {
if(i == 0) return false;
return s[i] == p[j] || p[j] == '.';
};
for(int i = 0; i <= n; i++)
for(int j = 1; j <= m; j++)
if(p[j] == '*') {
f[i][j] |= f[i][j - 2];
if(match(i, j - 1))
f[i][j] |= f[i - 1][j];
}
else {
if(match(i, j))
f[i][j] |= f[i - 1][j - 1];
}
return f[n][m];
}
};