【剑指Offer-代码的完整性】面试题19:正则表达式匹配
题目描述
请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配
思路
在编译原理中这类问题比较多见,常使用递归求解。首先这个问题可以分为2大类情况:两个字符串的第一个字符可以匹配(两个字符相等或者模板的第一个字符为'.')和不能匹配。当两个字符串可以匹配时,也要分为2种情况,模板字符串的第二位字符为'*'和不为'*'。当模板字符串的第二位为'*'时,可以将字符串指针右移一位,同时将模板指针右移两位,例如'ab'和'a*b';或者将字符串指针右移一位,同时保持模板指针不变,例如'aab'和'a*b'。如果两个字符串的第一个字符不能匹配(两个字符不相等并且模板的第一个字符不为'.'),也可以分为两种情况:模板的第二个字符为'*',则将模板指针右移两位(因为'*'前的字符可以出现0次),例如'ab'和'c*ab';否则两个字符串不匹配。对应代码如下:
class Solution {
public:
bool match(char* str, char* pattern)
{
if(str==nullptr || pattern==nullptr)
return false;
return matchCore(str, pattern);
}
bool matchCore(char* str, char* pattern)
{
if(*str=='\0' && *pattern=='\0')
return true;
if(*str!='\0' && *pattern=='\0')
return false;
if(*str==*pattern || (*pattern=='.' && *str!='\0'))
{
if(*(pattern+1)=='*')
return matchCore(str+1, pattern) || matchCore(str+1, pattern+2)
|| matchCore(str, pattern+2);
else return matchCore(str+1, pattern+1);
}
else if(*str!=*pattern && *(pattern+1)=='*')
return match(str, pattern+2);
else return false;
}
};