面试题:正则表达式匹配
题目描述:请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配
思路:
当模式中的第二个字符不是“*”时:
1、如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的。
2、如果 字符串第一个字符和模式中的第一个字符相不匹配,直接返回false。
而当模式中的第二个字符是“*”时:
如果字符串第一个字符跟模式第一个字符不匹配,则模式后移2个字符,继续匹配。如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式:
1、模式后移2字符,相当于x*被忽略;
2、字符串后移1字符,模式后移2字符;
3、字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位;
代码:
//时刻检查数组是否越界 public class Solution { public boolean match(char[] str, char[] pattern){ if(str==null||pattern==null) return false; int strIndex=0; int patternIndex=0; return matchCore(str,strIndex,pattern,patternIndex); } public boolean matchCore(char[] str, int strIndex,char[] pattern,int patternIndex){ //str到达末尾,pattern到达末尾 if(strIndex==str.length&&patternIndex==pattern.length) return true; //str到达末尾,pattern没有到达末尾 if(strIndex!=str.length&&patternIndex==pattern.length) return false; //模式第2个不是*,且字符串的第一个和模式的第一个匹配,依次判断下一个, 如果不匹配返回false if((strIndex!=str.length&&pattern[patternIndex]==str[strIndex])||(pattern[patternIndex]=='.'&&strIndex!=str.length)){ return matchCore(str,strIndex+1,pattern,patternIndex+1); } //模式的2个是*,且字符串和模式第一个匹配,分3种匹配模式。如果不匹配则模式后移两位 if(patternIndex+1<pattern.length&&pattern[patternIndex+1]=='*'){ if((strIndex!=str.length&&pattern[patternIndex]==str[strIndex])|| (strIndex!=str.length&&pattern[patternIndex]=='.')){ return matchCore(str,strIndex,pattern,patternIndex+2) //模式后移2字符,视为x*匹配0个字符; ||matchCore(str,strIndex+1,pattern,patternIndex+2)//字符串后移1字符,视为模式匹配1个字符; ||matchCore(str,strIndex+1,pattern,patternIndex); //字符串后移1字符,模式不变,继续匹配字符下一位,因为*可以匹配多位; }else{ return matchCore(str,strIndex,pattern,patternIndex+2); } } return false; } }