KK的技术人生

技术改变世界

2009年8月4日

使用正则表达式匹配嵌套Html标签

摘要: 概述 正则表达式是做文本解析工作必不可少的技能。如Web服务器日志分析,网页前端开发等。很多高级文本编辑器都支持正则表达式的一个子集,熟练掌握正则表达式,经常能够使你的一些工作事半功倍。例如统计代码行数,只需一个正则就搞定。嵌套Html标签的匹配是正则表达式应用中一个比较难的话题,因为它涉及到的正则语法比较多,也比较难。因此也就更有研究的价值。 思路 任何复杂的正则表达式都是由简单的子表达式... 阅读全文

posted @ 2009-08-04 01:18 KK2038 阅读(9867) 评论(3) 推荐(0) 编辑
使用正则表达式找出不包含特定字符串的条目

摘要: 概述 做日志分析工作的经常需要跟成千上万的日志条目打交道,为了在庞大的数据量中找到特定模式的数据,常常需要编写很多复杂的正则表达式。例如枚举出日志文件中不包含某个特定字符串的条目,找出不以某个特定字符串打头的条目,等等。 使用否定式前瞻 正则表达式中有前瞻(Lookahead)和后顾(Lookbehind)的概念,这两个术语非常形象的描述了正则引擎的匹配行为。需要注意一点,正则表达式钟的前和... 阅读全文

posted @ 2009-08-04 01:16 KK2038 阅读(5036) 评论(0) 推荐(0) 编辑