2022.4.14 正则表达式RegExp

8、正则表达式RegExp

在//里写表达式

8.1、方括号

方括号用于查找某个范围内的字符

表达式描述
[abc] 查找方括号之间的任何字符。
[^abc] 查找任何不在方括号之间的字符。
[0-9] 查找任何从 0 至 9 的数字。
[a-z] 查找任何从小写 a 到小写 z 的字符。
[A-Z] 查找任何从大写 A 到大写 Z 的字符。
[A-z] 查找任何从大写 A 到小写 z 的字符。
[adgk] 查找给定集合内的任何字符。
[^adgk] 查找给定集合外的任何字符。
(red|blue|green) 查找任何指定的选项。
复制代码
 1  <!DOCTYPE html>
 2  <html lang="en">
 3  <head>
 4      <meta charset="UTF-8">
 5      <title>Title</title>
 6      <script type="text/javascript" >
 7  8          var patt = new RegExp("e");//正则表达式  相当于  var patt = /e/;  两种写法
 9          alert(patt);//  /e/
10 11          var str = "abce";
12          alert(patt.test(str));//检测str字符串是否包含e  false
13 14          var patt1 = /[abc]/;//表示要求字符串中,是否包含a、b、c中任意一个
15          alert(patt1.test(str));
16 17          var patt2 = /[a-z]/;//查看是否包含a到z任意一个的小写字母
18          var patt3 = /[A-Z]/;//查看是否包含A到Z任意一个的大写字母
19          var patt4 = /[0-9]/;//查看是否包含0到9任意一个的数字
20 21 22      </script>
23  </head>
24  <body>
25 26  </body>
27  </html>
复制代码

8.2、元字符

元字符(Metacharacter)是拥有特殊含义的字符:

元字符描述
. 查找单个字符,除了换行和行结束符。
\w 查找单词字符。
\W 查找非单词字符。
\d 查找数字。
\D 查找非数字字符。
\s 查找空白字符。
\S 查找非空白字符。
\b 匹配单词边界。
\B 匹配非单词边界。
\0 查找 NUL 字符。
\n 查找换行符。
\f 查找换页符。
\r 查找回车符。
\t 查找制表符。
\v 查找垂直制表符。
\xxx 查找以八进制数 xxx 规定的字符。
\xdd 查找以十六进制数 dd 规定的字符。
\uxxxx 查找以十六进制数 xxxx 规定的 Unicode 字符。
复制代码
 1  <!DOCTYPE html>
 2  <html lang="en">
 3  <head>
 4      <meta charset="UTF-8">
 5      <title>Title</title>
 6      <script type="text/javascript" >
 7  8          // \w 元字符用于查找单词字符,是否包括:a-z、A-Z、0-9,以及下划线, 包含 _ (下划线) 字符。
 9          var patt = /\w/;
10 11          var str = "abce";
12          alert(patt.test(str));//true
13          
14          // \W 元字符用于查找非单词字符
15          var patt = /\W/;
16          
17      </script>
18  </head>
19  <body>
20 21  </body>
22  </html>
复制代码

8.3、量词

量词描述
n+ 匹配任何包含至少一个 n 的字符串。等价于n{1,}
n* 匹配任何包含(有一个条件满足就停止检查)零个或多个 n 的字符串。
n? 匹配任何包含零个或一个 n 的字符串。
n{X} 匹配包含 X 个 n (连续的X个n)的序列的字符串。
n{X,Y} 匹配包含 X 或 Y 个 n(最少X个最多Y个连续的n) 的序列的字符串。
n{X,} 匹配包含至少 X 个 n (至少连续的X个n)的序列的字符串。
n$ 匹配任何结尾为 n 的字符串。
^n 匹配任何开头为 n 的字符串。
?=n 匹配任何其后紧接指定字符串 n 的字符串。
?!n 匹配任何其后没有紧接指定字符串 n 的字符串。

 

复制代码
 1 <!DOCTYPE html>
 2  <html lang="en">
 3  <head>
 4      <meta charset="UTF-8">
 5      <title>Title</title>
 6      <script type="text/javascript" >
 7          
 8          // 字符串中是否至少一个a
 9          var patt = /a{3,5}/;
10 11          //匹配包含3或5个a(最少3个最多5个连续的a)的序列的字符串。
12          var str = "1212aaaaaaaa4545";
13          alert(patt.test(str));//true  在检查完前3个a后符合最少条件,不在检查后面 
14          //那么最大条件什么时候用呢?
15 16 17          var begin = /^a/;//以a开头
18          var end = /a$/;//以a结尾
19 20          //从头到尾严格匹配
21          var patt1 = /^a{3,5}$/;
22          alert(patt1.test(str));//false
23 24      </script>
25  </head>
26  <body>
27 28  </body>
29  </html>
复制代码

9.4、特殊字符

所谓特殊字符,就是一些有特殊含义的字符,如上面说的 runoo*b 中的 *,简单的说就是表示任何字符串的意思。如果要查找字符串中的 * 符号,则需要对 * 进行转义,即在其前加一个 \,runo\*ob 匹配字符串 runo*ob

许多元字符要求在试图匹配它们时特别对待。若要匹配这些特殊字符,必须首先使字符"转义",即,将反斜杠字符\放在它们前面。下表列出了正则表达式中的特殊字符:

特别字符描述
$ 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 '\n' 或 '\r'。要匹配 $ 字符本身,请使用 $
( ) 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符,请使用 ()
* 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 *
+ 匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 +
. 匹配除换行符 \n 之外的任何单字符。要匹配 . ,请使用 .
[ 标记一个中括号表达式的开始。要匹配 [,请使用 [
? 匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。要匹配 ? 字符,请使用 \?。
\ 将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如, 'n' 匹配字符 'n'。'\n' 匹配换行符。序列 '\' 匹配 "",而 '(' 则匹配 "("。
^ 匹配输入字符串的开始位置,除非在方括号表达式中使用,当该符号在方括号表达式中使用时,表示不接受该方括号表达式中的字符集合。要匹配 ^ 字符本身,请使用 \^。
{ 标记限定符表达式的开始。要匹配 {,请使用 {
| 指明两项之间的一个选择。要匹配 |,请使用 |

9.5、限定符

限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有 *+?{n}{n,}{n,m} 共6种。

正则表达式的限定符有:

字符描述
* 匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"* 等价于 {0,}
+ 匹配前面的子表达式一次或多次。例如,zo+ 能匹配 "zo" 以及 "zoo",但不能匹配 "z"+ 等价于 {1,}
? 匹配前面的子表达式零次或一次。例如,do(es)? 可以匹配 "do""does""doxy" 中的 "do"? 等价于 {0,1}

 

 

{n} n 是一个非负整数。匹配确定的 n 次。例如,o{2} 不能匹配 "Bob" 中的 o,但是能匹配 "food" 中的两个 o
{n,} n 是一个非负整数。至少匹配n 次。例如,o{2,} 不能匹配 "Bob" 中的 o,但能匹配 "foooood" 中的所有 oo{1,} 等价于 o+o{0,} 则等价于 o*
{n,m} m 和 n 均为非负整数,其中 n <= m。最少匹配 n 次且最多匹配 m 次。例如,o{1,3} 将匹配 "fooooood" 中的前三个 oo{0,1} 等价于 o?。请注意在逗号和两个数之间不能有空格。

以下正则表达式匹配一个正整数,[1-9]设置第一个数字不是 0,[0-9]* 表示任意多个数字:

 /[1-9][0-9]*/

 

 

请注意,限定符出现在范围表达式之后。因此,它应用于整个范围表达式,在本例中,只指定从 0 到 9 的数字(包括 0 和 9)。

这里不使用 + 限定符,因为在第二个位置或后面的位置不一定需要有一个数字。也不使用 ? 字符,因为使用 ? 会将整数限制到只有两位数。

如果你想设置 0~99 的两位数,可以使用下面的表达式来至少指定一位但至多两位数字。

 /[0-9]{1,2}/

上面的表达式的缺点是,只能匹配两位数字,而且可以匹配 0、00、01、10 99 的章节编号仍只匹配开头两位数字。

改进下,匹配 1~99 的正整数表达式如下

 /[1-9][0-9]?/  或    /[1-9][0-9]{0,1}/
 
posted @   暴躁C语言  阅读(32)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
点击右上角即可分享
微信分享提示