正则表达式

正则表达式是由一些具有特殊含义的字符组成的字符串，多用于查找、替换符合规则的字符串。在表单验证、Url映射等处都会经常用到。我们常使用缩写的术语“regex”或“regexp”。

一.元字符

元字符：即为有特定含义的字符，常见的元字符如下：

代码	说明
.	匹配除换行符以外的任意字符
\w	匹配字母或数字或下划线或汉字
\s	匹配任意的空白符
\d	匹配数字
\b	匹配单词的开始或结束
^	从开始行开始匹配
$	匹配字符串的结束

详解和示例：

（1）. 匹配任何任意字符例如 . 可以匹配 1，n，*，+，- ,等

（2）\d\w\s 匹配第一个字符为数字，第二个字符为字母或数字、或下划线或汉字，第三字符为空格的字符串例如：11 ，2a , 1_

（3）^\d\d\d$ 匹配三个全部都为数字的字符串例如： 123,456,789

二.反义字符

反义字符：多用于查找除某个字符以外其他任意字符均可以的情况。

常用的反义字符如下：

代码/语法	说明
\W	匹配任意不是字母，数字，下划线，汉字的字符
\S	匹配任意不是空白符的字符
\D	匹配任意非数字的字符
\B	匹配不是单词开头或结束的位置
[an]p	字符集，匹配ap和np
[^x]	匹配除了x以外的任意字符
[^aeiou]	匹配除了aeiou这几个字母以外的任意字符

详解和示例：

（1）\W 匹配除字母、数字、下划线、汉字以为的字符形如 +，-，*

（2）\S 匹配除空格以外的任意字符形如：1，* ，）

（3）[^asd] 匹配除asd以为的其他字符如 e，f，g，h

三.限定字符

限定字符多用于重复匹配次数，常用的限定字符如下：

代码/语法	说明
*	重复零次或更多次
+	重复一次或更多次
?	重复零次或一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n到m次

详解和示例：

（1）\d* 匹配重复0次或多次数字例如:可能为空或任意数字（2,3。。。。）

（2）\d+ 匹配重复1次或多次数字例如:可能为1个或多个数字 1,23,234,2345，........

（3）\d? 匹配重复次个或者一次数字例如：可能为空或者任意的一个数字（1,2，。。。）

（4）\d{8}匹配重复8次数字例如：123456768

（5）\d{4,}匹配重复至少4次数字例如：1234,12345,124244,。。。。。

（6）^\d{8,11}$ 匹配重复8-11次数字例如：12345678,123456789,1234567890,12345678901

四.转义字符

在实际的开发中，可能会遇到要比配元字符的情况，这个时候就需要进行字符转义，如元字符 . * \ 需要转换为. * \

例如：需要匹配qq邮箱 \d{6,11}.qq.com 在这里的. 就需要加斜杠。

五.字符分枝

字符分枝多用于满足不同情况的选择，用“|”将不同的条件分割开来，比如有些固定电话区号有三位，有些有四位，这个时候可以采用字符分枝。

例如：\d{3}-\d{8}|\d{4}-\d{8} 可以匹配两种不同长度区号的固定电话

六.字符分组

字符分组多用于将多个字符重复，主要通过使用小括号()来进行分组

形如：（\d\w){3} 重复匹配3次（\d\w)

常用于表示IP地址形如： /\b((25[0-5]|2[0-4]\d|[01]?\d\d?).){3}(25[0-5]|2[0-4]\d|[01]?\d\d?)\b/gm 解析：ipV4 地址由16进制构成，范围为0-255 链接：https://regex101.com/r/vqx8cg/1

七.懒惰匹配与贪婪匹配

贪婪匹配：正则表达式中包含重复的限定符时，通常的行为是匹配尽可能多的字符。

懒惰匹配，有时候需要匹配尽可能少的字符。

例如： a.*b，它将会匹配最长的以a开始，以b结束的字符串。如果用它来搜索aabab的话，它会匹配整个字符串aabab。但是我们此时可能需要匹配的是ab这样的话就需要用到懒惰匹配了。懒惰匹配会匹配尽可能少的字符

常用的懒惰匹配限定符如下：

代码/语法	说明	举例
*?	重复任意次，但尽可能少重复
+?	重复1次或更多次，但尽可能少重复	https://regex101.com/r/CxVei9/1
??	重复0次或1次，但尽可能少重复
{n,m}?	重复n到m次，但尽可能少重复	https://regex101.com/r/z4b8Y5/1
{n,}?	重复n次以上，但尽可能少重复

八.捕获、断言

分类	代码/语法	说明	举例
捕获	(exp)	匹配exp,并捕获文本到自动命名的组里	https://regex101.com/r/xuzQQL/1
	(?exp)	匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)	https://regex101.com/r/38OoKH/1
	(?:exp)	匹配exp,不捕获匹配的文本，也不给此分组分配组号	https://regex101.com/r/ZC2lo2/1
零宽断言	(?=exp)	匹配exp前面的位置
	(?<=exp)	匹配exp后面的位置
	(?!exp)	匹配后面跟的不是exp的位置
	(?<!exp)	匹配前面不是exp的位置

回溯

例：https://regex101.com/r/QQMq5B/1

匹配 abba格式 https://regex101.com/r/j5h0lT/1

正向先行断言

https://regex101.com/r/9EE88F/1

正向后行断言

https://regex101.com/r/yk5K07/1

九.其他语法

代码/语法	说明
\a	报警字符(打印它的效果是电脑嘀一声)
\b	通常是单词分界位置，但如果在字符类里使用代表退格
\t	制表符，Tab
\r	回车
\v	竖向制表符
\f	换页符
\n	换行符
\e	Escape
\0nn	ASCII代码中八进制代码为nn的字符
\xnn	ASCII代码中十六进制代码为nn的字符
\unnnn	Unicode代码中十六进制代码为nnnn的字符
\cN	ASCII控制字符。比如\cC代表Ctrl+C
\A	字符串开头(类似^，但不受处理多行选项的影响)
\Z	字符串结尾或行尾(不受处理多行选项的影响)
\z	字符串结尾(类似$，但不受处理多行选项的影响)
\G	当前搜索的开头
\p{name}	Unicode中命名为name的字符类，例如\p{IsGreek}
(?>exp)	贪婪子表达式
(?<x>-<y>exp)	平衡组
(?im-nsx:exp)	在子表达式exp中改变处理选项
(?im-nsx)	为表达式后面的部分改变处理选项
(?(exp)yes\|no)	把exp当作零宽正向先行断言，如果在这个位置能匹配，使用yes作为此组的表达式；否则使用no
(?(exp)yes)	同上，只是使用空表达式作为no
(?(name)yes\|no)	如果命名为name的组捕获到了内容，使用yes作为表达式；否则使用no
(?(name)yes)	同上，只是使用空表达式作为no

十.总结

正则表达式是前端开发中的基础，但由于开发中几乎用不到，容易遗忘，需要用到的特许匹配规则也不容易查询，不如就用20分钟理解一下基础，满足以上情况的需要。此上也不过为正则表达式的基础中的基础，满足大部分的需求，此外还有平衡组、递归匹配等需要精进。

如下：检验学习成果的练习网站

https://www.codejiaonang.com/#/course/regex_chapter1/0/0

posted @ 2021-12-18 22:25 Dorae91 阅读(105) 评论(0) 收藏举报

刷新页面返回顶部

Dorae91

正则表达式

一.元字符

二.反义字符

三.限定字符

四.转义字符

五.字符分枝

六.字符分组

七.懒惰匹配与贪婪匹配

八.捕获、断言

九.其他语法

十.总结

公告