正则表达式

                                                                                                                             正则表达式笔记
基础:
作用:匹配字符串
应用:登录、搜索、手写输入等
(支持各种语言)
正则表达式制定了一种规则,来找到可以匹配的字符串。

界定符:
开始和结束 /表达式/   #表达式#  {表达式}一般不使用,因为大括号也是一种运算符
Regexpal在线正则表达式验证工具
原子:
不可见原子-Unicode编码表中用键盘输出后肉眼不可见的字符(空格、\n、\r、\t等)
可见原子-字母、数字、特殊字符等

元字符:(定义原子筛选方式、对某一类原子进行归类)
定义原子筛选方式
-|  匹配两个或者多个分支选择
-[]  匹配方括号中的任意一个原子,取消元字符的特殊功能(\ ^ -例外)
-[^] 匹配除方括号中的原子之外的任意字符(^必须写在最前)
-. 匹配除换行符以外的任意字符
-\d [0-9]
-\D  [^0-9]
-\s  匹配一个不可见原子[\f\n\r\t\v]
-\S 匹配一个可见原子[^\f\n\r\t\v]
-\w 匹配任意一个数字、字母或下划线[0-9a-zA-Z_]
-\W [^0-9a-zA-Z_]
量词:
?:零个或一个 {0,1}
+:一个或多个 {1,}
*:零个或多个{0,}
{n} : 精确匹配n次
{n,} :匹配n次或更多次
{m,n} :匹配m至n次
边界控制:
·^ 匹配字符串开始的位置
·$ 匹配字符串结尾的位置
模式单元:
·()匹配其中的整体为一个原子
?P<id>可以用这种方法,为匹配到的组添加一个名字
 
 
高级:
修正模式(写在边界外):
·贪婪匹配
-匹配结果存在歧义时取其长
·懒惰匹配
-匹配结果存在歧义时取其短
常见修正模式:
·U 懒惰模式
·i 忽略英文字母大小写
·x 忽略空白
·s 让元字符‘.’匹配包括换行符在内所有字符

posted on 2018-05-26 09:33  风度翩翩的机器空  阅读(111)  评论(0编辑  收藏  举报

导航