规则1:正则表达式引擎会对输入字符串尽快地开始匹配。它一次搜索一个字符,直到发现一次匹配。
例如:
string = 123 ABC 456 DEF
Regex = [A-Z]*
这里会从ABC开始匹配
规则2:发现一个匹配的开头后,正则表达式引擎将继续匹配,直到遇到一个不被模式接收的字符。
例如:
string = 123 ABC 456 DEF
Regex = [A-Z]*
这里第一次匹配从ABC开始,当遇到模式不接受的空格时结束。
规则3:Regex引擎非常贪婪--只要模式允许,它将匹配尽可能多的字符。
例如:
string = 'Dr Watson's watch'
Regex = '.*'
这里会匹配'Dr Watson's watch',如果修改模式为'.*?',是“*”成为一个非贪婪的限定符。这时会匹配'Dr Watson'
规则4:Regex引擎渴望实现匹配,所以将在需要时回溯以实现匹配。
例如:
string = 'Hello world's said K & R.
Regex = '.*'
这里匹配'Hello world'。
如果将模式设置为非回溯的“'(?>.*)'”这时就找不到匹配了。因为“.*”匹配了右侧直到结束的所有字符,并且不使用回溯,所以无法匹配。
规则5:Regex引擎总是选择第一个选项。
例如:
string = 1234 123 3456
Regex = (\d{2}|\d{3}|\d{4})
这里匹配结果是:
12
34
12
34
56