正则表达式匹配
时间限制:C/C++ 1秒,其他语言2秒 空间限制:C/C++ 32M,其他语言64M
题目描述
请实现一个函数用来匹配包括'.'和''的正则表达式。模式中的字符'.'表示任意一个字符,而''表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"abaca"匹配,但是与"aa.a"和"ab*a"均不匹配
思路:
首先,考虑特殊情况:
- 两个字符串都为空,返回true
- 当第一个字符串不空,而第二个字符串空了,返回false(因为这样,就无法匹配成功了,而如果第一个字符串空了,第二个字符串非空,还是可能匹配成功的,比如第二个字符串是“aaaa”,由于‘*’之前的元素可以出现0次,所以有可能匹配成功)
然后就开始匹配第一个字符,这里有两种可能:匹配成功或匹配失败。但考虑到pattern下一个字符可能是‘’, 这里我们分两种情况讨论:pattern下一个字符为‘’或不为‘*’:
- pattern下一个字符不为‘*’:这种情况比较简单,直接匹配当前字符。如果匹配成功,继续匹配下一个;如果匹配失败,直接返回false。注意这里的 “匹配成功”,除了两个字符相同的情况外,还有一种情况,就是pattern的当前字符为‘.’,同时str的当前字符不为‘\0’。
- pattern下一个字符为‘’时,稍微复杂一些,因为‘’可以代表0个或多个。这里把这些情况都考虑到:
a. 当‘’匹配0个字符时,str当前字符不变,pattern当前字符后移两位,跳过这个‘’符号;
b. 当‘*’匹配1个或多个时,str当前字符移向下一个,pattern当前字符不变。(这里匹配1个或多个可以看成一种情况,因为:当匹配一个时,由于str移到了下一个字符,而pattern字符不变,就回到了上边的情况a;当匹配多于一个字符时,相当于从str的下一个字符继续开始匹配)
class Solution {
public:
bool match(char* str, char* pattern)
{
if(*str == '\0' && *pattern == '\0')
return true;
if(*str != '\0' && *pattern == '\0')
return false;
if(*(pattern+1) != '*')
{
if(*str == *pattern || (*str != '\0' && *pattern == '.'))
return match(str+1,pattern+1);
else
return false;
}
else
{
if(*str == *pattern || (*str != '\0' && *pattern == '.'))
return match(str,pattern+2)||match(str+1,pattern);
else
return match(str,pattern+2);
}
}
};