正则表达式中的贪婪与非贪婪
2011-06-22 21:55 kaure 阅读(201) 评论(0) 编辑 收藏 举报我们从代码开始:
Regex reg=new Regex("a.*b");
foreach (Match m in reg.Matches("aabab"))
{
Console.WriteLine(m.Value);
}
Console.WriteLine("-------");
reg = new Regex("a.*?b");
foreach (Match m in reg.Matches("aabab"))
{
Console.WriteLine(m.Value);
}
最后我们得到的结果是:
aabab
-------
aab
ab
当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符,因此在a.*b下,正则尽可能多的匹配以最长的以a开始,以b结束的字符串.因此得到的结果是aabab。
但是对于a.*?b 非贪婪模式来说,它是在保证整个匹配成功的前提下使用最少的重复。不难看出其匹配过程,从字符a开始,到aa,不匹配,再增加匹配aab, 成功。。。然后从最后一个a 再次开始搜索匹配。也就是说非贪婪的不正确使用其实有可能会造成性能的下降,比如用a.*?bz去匹配abbbbbbbbbbbbbbbbbbbbbb.......会花相当长的时间。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架