正则表达式基本语法

介绍:首先说下正则表达式的语法组成,及各个元素的含义。 





  还有三个字符的用法  补充在后面    

如上图:

 1.字符 . 表示可以匹配任意字符(除了\n) 即在正则表达式中如果出现了 . 则在要匹配的字符串这个对应位置可以是任意字符

 2.[ ]  中括号中可以放入一个字符串,代表可以匹配这个字符串中的任意一个字符    

         例: [abcd] 即可以匹配abcd中任意一个字符    注:如果要匹配A到Z之间任意一个字符可以写 作[A-Z]  同理[a-z]   [0-9]

3.\d可以匹配任意一个数字 \D可以匹配任意一个非数字   同理 \s 空白字符指空格、换行、tab   \S   \w  \W

4. *指匹配前一个字符无限次    

         例:[\d]* 指可以匹配0-9 任意一个数字无限次  同理[ ] 中可以放\s  \w 等     +  ? 用法同 *

5. {m}匹配前一个字符m次     

 例:[\d]{5} 指可以匹配0-9任意一个数字5次   {m,n}指匹配前一个字符m到n次

6. +?       因为*指匹配前一个字符1次或者是无限次   所以+?指匹配前一个字符1次后  尽可能不匹配前一个字符     *?   ??用法同前

 例:[\d]+?     待匹配字符串为45621     匹配结果为4

7. |  匹配左右任一个表达式   

 例:163|126    待匹配字符串为163则输出结果为163   带匹配字符串为126 则输出结果为126

8. (ac)将表达式分组   

 例:asd(dd1) 则dd1为一个分组可以单独操作     正则表达式 :[\w]{4,10}@(163|126|qq).com     待匹配表达式7855@163.com   待匹配表达式中163可以换为126或者qq

9.\<number>  引用编号为num的分组匹配到的字符串   

 例:正则表达式   :<([\w]{4}>)\1([\w]{3}>)\2          待匹配字符串<book>book>fff>fff>  第一个()中的字符串由\1 引用   第二个()中的字符串由\2引用

10(?P<name>)  分组起一个别名  (?P=name)引用别名为name的串

 例:正则表达式<(?P<mark>[\w]{4}>)[\w]+</(?P=mark)      待匹配串   <book>python</book>     给第一个括号内的取名为mark   在第二个括号内引用

11. ^  匹配字符串开头   即待匹配字符串的开头必须按照正则表达式的要求形式     

      $  匹配字符串结尾 即待匹配字符串的结尾必须按照正则表达式的要求形式

 例:正则表达式   [\w]{4,10}@163.com$   待匹配字符串的结尾必须是@163.com不能多 也不能少

12 \A or  \Z  指定的字符串必须出现在开头  or  结尾   

     \Z同理加在结尾

例: 正则表达式  \A sdff[\w]*   待匹配字符串sdff456ss可以匹配 asdff456ss无法匹配  


以上



posted @ 2017-07-29 15:48  非我非非我  阅读(443)  评论(0编辑  收藏  举报