正则表达式基本语法

正则表达式的组成：界定符，原子，元字符，量词,模块单元及边界控制
eg：手机号：/^1[34578]\d{9}$/ 或 /^1(3|5|4|7|8)\d{9}$/
     浮点数：\d+\.\d{2}$

1.界定符表示一个正则表达式的开始和结束
   一般用“/” 来表示正则的开始和结束

2.原子
|
分为【可见原子】和【不可见原子】，【可见原子】指的是Unicoce编码表中用键盘输出后内眼可见的字符，
否则都属于【不可见原子】。
|
【可见原子】
| 1)标点：; ? .等
| 2)英文字母、数字 a-z A-Z 0-9
| 3)汉字及其他语言文字
| 4)数理化公司符号
| 5)其他可见字符
|
【不可见原子】
|
| 1) 换行符 \n
| 2) 回车 \r
| 3) 制表符 \t
| 4) 空格
| 5）其他不可见符号

3.元字符
     作用：1.定义原子的筛选方式 2.原子归类简化正则表达式字符匹配
     1）原子筛选方式
     - |   匹配两个或多个分支选择
     - [] 匹配方括号中的任意一个原子
     - [^] 匹配方括号中的原子之外的任意字符

     2）原子归类
     - . 匹配除换行符之外的任意字符
     - \d 匹配任意一个十进制数字，即[0-9]
     - \D 匹配任意一个非十进制数字，即[^0-9]
     - \s 匹配一个不可见原子
     - \S 匹配一个可见原子
     - \w 匹配任意一个数字、字母或下划线
     - \W 匹配任意一个非数字、字母或下划线

4.量词
     - {n} 表示其前面的原子恰好出现n次
     - {n,} 表示其前面的原子最少出现n次
     - {n,m}表示其前面的原子最少出现n次最多出现m次
     - * 匹配0次 1次或者多次其之前的原子即{0,}
     - + 匹配1次或者多次其之前的原子，即{1,0}
     - ? 匹配0次或者1次其之前的原子，{0,1}

5. 边界控制

    ^ 匹配字符串开始位置
    $ 匹配字符串结尾位置

6.模块单元
     ()匹配其中的整体为一个原子

匹配模式

    1.贪婪匹配(默认)
    2.懒惰匹配

修正模式
    U -懒惰匹配
    i -忽略英文字母大小写
    x -忽略空白
    s -让无元字符 '.'匹配扬换行符在内所有字符

   用法 : /正则表达式/Uixs

posted @ 2016-05-20 08:55 Koo1~ 阅读(278) 评论(0) 收藏举报

刷新页面返回顶部

酷

正则表达式基本语法

公告