1、符号释义
① () 分组符,把括号内的字符当成一个整体处理。
② . 与换行符外的字符都匹配,针对单字符。
③ + 前一字符必须存在,可以重复1次或更多次
④ ?跟在子串后,表示匹配前面的子串1次或0次,即前一字符可以存在也可以不存在,但是存在只能有一次;
跟在*、+、?后,表示进入非贪婪模式,也称为惰性模式。
2、贪婪/非贪婪模式
*正则默认贪婪模式
①贪婪模式
尽可能匹配最长的字符串。贪婪匹配是先看整体字符串是否匹配,如果不匹配,它会去掉字符串中的最后一个字符再次尝试匹配。以此循环,直至匹配成功。
②非贪婪模式
尽可能匹配最短的字符串。惰性匹配是从左侧第一个字符向右匹配,先看是否匹配,若不匹配,就加入右侧下一个字符再次尝试匹配。以此循环,直至匹配成功。
3、实例
存在字符串"<1><123>"
①正则表达式<(.+)>表示尽可能匹配最长的符合规则<字符串>的内容,最终返回"<1><123>"
②正则表达式<(.+?)>表示尽可能匹配最短的符合规则<字符串>的内容,最终返回"<1>"