10. 正则表达式匹配

题目中的匹配是一个「逐步匹配」的过程:我们每次从字符串 p 中取出一个字符或者「字符 + 星号」的组合,并在 s 中进行匹配。对于 p 中一个字符而言,它只能在 s 中匹配一个字符,匹配的方法具有唯一性;而对于 p 中字符 + 星号的组合而言,它可以在 s 中匹配任意自然数个字符,并不具有唯一性。因此我们可以考虑使用动态规划,对匹配的方案进行枚举。

我们用 \(f[i][j]\) 表示 s 的前 \(i\) 个字符与 p 中的前 \(j\) 个字符是否能够匹配。在进行状态转移时,我们考虑 p 的第 \(j\) 个字符的匹配情况:

如果 p 的第 \(j\) 个字符是一个小写字母,那么我们必须在 s 中匹配一个相同的小写字母,即

\[f[i][j] = \begin{cases} f[i - 1][j - 1], & s[i] = p[j]\\ \text{false}, & s[i] \neq p[j] \end{cases} \]

也就是说,如果 s 的第 \(i\) 个字符与 p 的第 \(j\) 个字符不相同,那么无法进行匹配;否则我们可以匹配两个字符串的最后一个字符,完整的匹配结果取决于两个字符串前面的部分。

如果 p 的第 \(j\)个字符是 *,那么就表示我们可以对 p 的第 \(j-1\) 个字符匹配任意自然数次。在匹配 \(0\) 次的情况下,我们有

\[f[i][j]=f[i][j−2] \]

也就是我们「浪费」了一个字符 + 星号的组合,没有匹配任何 s 中的字符。

在匹配 \(1,2,3, \cdots\) 次的情况下,类似地我们有

\[\begin{aligned} & f[i][j] = f[i - 1][j - 2], \quad && \text{if } s[i] = p[j - 1] \\ & f[i][j] = f[i - 2][j - 2], \quad && \text{if } s[i - 1] = s[i] = p[j - 1] \\ & f[i][j] = f[i - 3][j - 2], \quad && \text{if } s[i - 2] = s[i - 1] = s[i] = p[j - 1] \\ & \cdots\cdots & \end{aligned} \]

总的转移方程如下:

\[f[i][j] \ |= \begin{cases} f[i][j−2] \\ f[i - 1][j - 2] \And\And s[i] = p[j - 1] \\ f[i - 2][j - 2] \And\And s[i - 1] = s[i] = p[j - 1] \\ f[i - 3][j - 2] \And\And s[i - 2] = s[i - 1] = s[i] = p[j - 1] \\ \cdots\cdots \end{cases} \]

如果我们通过这种方法进行转移,那么我们就需要枚举这个组合到底匹配了 s 中的几个字符,会增导致时间复杂度增加。

\(i - 1\)代替上式的\(i\)得到:

\[f[i-1][j] \ |= \begin{cases} f[i-1][j−2] \\ f[i - 2][j - 2] \And\And s[i-1] = p[j - 1] \\ f[i - 3][j - 2] \And\And s[i - 2] = s[i - 1] = p[j - 1] \\ \cdots\cdots \end{cases} \]

于是转移方程可简化为:

\[f[i][j] \ |= \begin{cases} f[i][j−2] \\ f[i - 1][j] \And\And s[i] = p[j - 1] \end{cases} \]

总的转移方程如下:

\[f[i][j] |= \begin{cases} f[i - 1][j - 1] \And\And s[i] = p[j] & p[j] \ne '*' \\ f[i][j-2] \ || \ f[i-1][j] \And\And s[i] = p[j-1] & p[j] = '*' \end{cases} \]

注意点

第一层循环\(i\)下标从\(0\)开始,因为'*'可以匹配\(0\)个元素。

class Solution {
public:
    bool isMatch(string s, string p) {
        int n = s.size(), m = p.size();
        s = ' ' + s, p = ' ' + p;
        
        vector<vector<int>> f(n + 1, vector<int>(m + 1));
        f[0][0] = true;
        
        auto match = [&](int i, int j) {
            if(i == 0) return false;
            return s[i] == p[j] || p[j] == '.';
        };
        
        for(int i = 0; i <= n; i++)
            for(int j = 1; j <= m; j++)
                if(p[j] == '*') {
                    f[i][j] |= f[i][j - 2];
                    if(match(i, j - 1))
                        f[i][j] |= f[i - 1][j];
                }
                else {
                    if(match(i, j)) 
                        f[i][j] |= f[i - 1][j - 1];
                }
        
        return f[n][m];
    }
};
posted @ 2021-07-15 16:14  Dazzling!  阅读(60)  评论(0编辑  收藏  举报