正则表达式-(2)量词与贪婪

贪婪模式，简单说就是尽可能进行最长匹配。非贪婪模式呢，则会尽可能进行最短匹配。

一、贪婪匹配(Greedy)

首先，我们来看一下贪婪匹配。在正则中，表示次数的量词默认是贪婪的，在贪婪模式下，会尝试尽可能最大长度去匹配。

举个栗子：

a* 在匹配开头的 a 时，会尝试尽量匹配更多的 a，直到第一个字母 b 不满足要求为止，匹配上三个 a，后面每次匹配时都得到了空字符串。

二、非贪婪匹配(Lazy)

如何将贪婪模式变成非贪婪模式呢？可以在量词后面加上英文的问号 (?)，正则就变成了 a*?。此时的匹配结果如下：

这次匹配到的结果都是单个的 a，就连每个 a 左边的空字符串也匹配上了。

再来看一个示例，这次查找一下引号中的单词。

三、独占模式(Possessive)

不管是贪婪模式，还是非贪婪模式，都需要发生回溯才能完成相应的功能。但是在一些场景下，不需要回溯，匹配不上返回失败就好了，因此正则中还有另外一种模式，独占模式，它类似贪婪匹配，但匹配过程不会发生回溯，因此在一些场合下性能会更好。

举个栗子看下什么是回溯。regex:"xy{1,3}z" text:"xyyz"

在匹配时，y{1,3}会尽可能长地去匹配，当匹配完 xyy 后，由于 y 要尽可能匹配最长，即三个，但字符串中后面是个 z 就会导致匹配不上，这时候正则就会向前回溯,吐出当前字符z，接着用正则中的z去匹配。

如果把正则改成非贪婪模式呢，regex:"xy{1,3}?z" text:"xyyz"

由于 y{1,3}? 代表匹配 1 到 3 个 y，尽可能少地匹配。匹配上一个 y 之后，也就是在匹配上 text 中的 xy 后，正则会使用 z 和 text 中的 xy 后面的 y 比较，发现正则 z 和 y 不匹配，这时正则就会向前回溯，重新查看 y 匹配两个的情况，匹配上正则中的 xyy，然后再用 z 去匹配 text 中的 z，匹配成功。