正则表达式基本语法



 正则表达式的组成: 界定符,原子,元字符,量词,模块单元及边界控制
 eg:手机号:/^1[34578]\d{9}$/ 或 /^1(3|5|4|7|8)\d{9}$/
     浮点数:\d+\.\d{2}$

1.界定符 表示一个正则表达式的开始和结束
   一般用“/” 来表示正则的开始和结束

2.原子
  |
  分为【可见原子】和【不可见原子】,【可见原子】指的是Unicoce编码表中用键盘输出后内眼可见的字符,
  否则都属于【不可见原子】。
  |
 【可见原子】
  |  1)标点:; ? .等
  |  2)英文字母、数字 a-z A-Z 0-9
  |  3)汉字 及其他语言文字
  |  4)数理化公司符号
  |  5)其他可见字符
  |
 【不可见原子】
  |  
  |  1) 换行符 \n
  |  2) 回车 \r
  |  3) 制表符 \t
  |  4) 空格
  |  5)其他不可见符号

3.元字符
     作用:1.定义原子的筛选方式 2.原子归类简化正则表达式字符匹配
     1)原子筛选方式
     - |   匹配两个或多个分支选择
     - []  匹配方括号中的任意一个原子
     - [^] 匹配方括号中的原子之外的任意字符
     
     2)原子归类
     - . 匹配除换行符之外的任意字符
     - \d 匹配任意一个十进制数字,即[0-9]
     - \D 匹配任意一个非十进制数字,即[^0-9]
     - \s 匹配一个不可见原子
     - \S 匹配一个可见原子
     - \w 匹配任意一个数字、字母或下划线
     - \W 匹配任意一个非数字、字母或下划线

4.量词
     - {n}  表示其前面的原子恰好出现n次
     - {n,} 表示其前面的原子最少出现n次
     - {n,m}表示其前面的原子最少出现n次 最多出现m次
     - * 匹配0次 1次或者多次其之前的原子 即{0,}
     - + 匹配1次或者多次其之前的原子,即{1,0}
     - ? 匹配0次或者1次其之前的原子,{0,1}

5. 边界控制
     
    ^ 匹配字符串开始位置
    $ 匹配字符串结尾位置
 
6.模块单元    
     ()匹配其中的整体为一个原子

匹配模式

    1.贪婪匹配(默认)
    2.懒惰匹配

修正模式
    U -懒惰匹配
    i -忽略英文字母大小写
    x -忽略空白
    s -让无元字符 '.'匹配扬换行符在内所有字符

   用法 : /正则表达式/Uixs
posted @ 2016-05-20 08:55  Koo1~  阅读(256)  评论(0编辑  收藏  举报