Code

     让我们分析一下第二行的正则表达式

     ^ 行开始
     \s*     
     匹配字符前面的所有空格,贪婪模式重复
     (.*?)   
     捕获组,勉强模式重复匹配任意字符,也就是我们最终需要(去掉前后空格后)的字符,这个不是很好理解(我认为)

     第一:我原来认为在捕获组内也应该判断第一个字符应该不能为空格即写成([^\s+])的形式,但这是完全没有必要的因为捕获组前面的\s*已经能捕获开头的所有的空格字符了,你认为的捕获组的字符开始范围与正则表达式匹配的字符范围是不一样的,汗~有点说不清楚了,呵呵
     第二:其中?的作用,他的作用就是勉强模式重复前面的字符,什么意思呢?就是如果我用(.*a)去匹配aaaaaaa字符串的结果就是(aaaaaaa)源字符串这叫贪婪模式,如果用(.*?a)去匹配aaaaaaa的话他就会先匹配第一a,然后是第二个a,然后是第三个a.......这就叫勉强模式匹配有的地方也叫懒惰模式匹配。通俗一点(大家都喜欢通俗的解释,呵呵)就是前者是从后往前去匹配尽可能多的字符,而后者是从前往后匹配
     第三:我们还要不要去关心捕获组中后面的空格呢?因为捕获组中的"."也是可以匹配空格的,先前我也是考虑这个问题大部分时间都浪费在这上面了.其实这和考虑要不要排除捕获组前面的空格一样的道理,后面的\s*已经给我们处理了

     \s*匹配字符后面的空格

     如有不对地方,欢迎指出来,交流才能进步

 

     

     

posted on 2009-03-19 14:25  ilovejsj  阅读(3670)  评论(0编辑  收藏  举报