代码改变世界

正则表达式中的贪婪与非贪婪

  kaure  阅读(201)  评论(0编辑  收藏  举报

我们从代码开始:

复制代码
Regex reg=new Regex("a.*b");
foreach (Match m in reg.Matches("aabab"))
{
Console.WriteLine(m.Value);
}
Console.WriteLine(
"-------");

reg
= new Regex("a.*?b");
foreach (Match m in reg.Matches("aabab"))
{
Console.WriteLine(m.Value);
}
复制代码

最后我们得到的结果是:

aabab
-------
aab
ab

        当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符,因此在a.*b下,正则尽可能多的匹配以最长的以a开始,以b结束的字符串.因此得到的结果是aabab。

     但是对于a.*?b 非贪婪模式来说,它是在保证整个匹配成功的前提下使用最少的重复。不难看出其匹配过程,从字符a开始,到aa,不匹配,再增加匹配aab, 成功。。。然后从最后一个a 再次开始搜索匹配。也就是说非贪婪的不正确使用其实有可能会造成性能的下降,比如用a.*?bz去匹配abbbbbbbbbbbbbbbbbbbbbb.......会花相当长的时间。

编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
点击右上角即可分享
微信分享提示