正则表达式

　　　　　　　　 正则表达式笔记
基础：
作用：匹配字符串
应用：登录、搜索、手写输入等
（支持各种语言）

正则表达式制定了一种规则，来找到可以匹配的字符串。

界定符：
开始和结束 /表达式/ #表达式# {表达式}一般不使用，因为大括号也是一种运算符
Regexpal在线正则表达式验证工具

原子：
不可见原子-Unicode编码表中用键盘输出后肉眼不可见的字符（空格、\n、\r、\t等）
可见原子-字母、数字、特殊字符等

元字符：（定义原子筛选方式、对某一类原子进行归类）
定义原子筛选方式
-| 匹配两个或者多个分支选择
-[] 匹配方括号中的任意一个原子，取消元字符的特殊功能（\ ^ -例外）
-[^] 匹配除方括号中的原子之外的任意字符（^必须写在最前）
-. 匹配除换行符以外的任意字符
-\d [0-9]
-\D [^0-9]
-\s 匹配一个不可见原子[\f\n\r\t\v]
-\S 匹配一个可见原子[^\f\n\r\t\v]
-\w 匹配任意一个数字、字母或下划线[0-9a-zA-Z_]
-\W [^0-9a-zA-Z_]

量词：
？：零个或一个 {0,1}
+：一个或多个 {1,}
*：零个或多个{0,}
{n} ：精确匹配n次
{n，} ：匹配n次或更多次
{m，n} ：匹配m至n次

边界控制：
·^ 匹配字符串开始的位置
·$ 匹配字符串结尾的位置

模式单元：
·（）匹配其中的整体为一个原子

?P<id>可以用这种方法，为匹配到的组添加一个名字

高级：
修正模式（写在边界外）：
·贪婪匹配
-匹配结果存在歧义时取其长
·懒惰匹配
-匹配结果存在歧义时取其短
常见修正模式：
·U 懒惰模式
·i 忽略英文字母大小写
·x 忽略空白
·s 让元字符‘.’匹配包括换行符在内所有字符

posted on 2018-05-26 09:33 风度翩翩的机器空阅读(111) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

风度翩翩

正则表达式

导航

公告