第二次学正则表达式 概念与元字符

什么是正则表达式?

有时候,我们查找某个文件,可能会使用 * ?等符号,这种叫做通配符。

正则表达式更为准确的去匹配(描述)你所需要的字符串。可以说它是记录文本规则的代码。

 

举例一个正则表达式

一个非常简单的正则:code

很明确的信息去匹配包含code的所有字符串

比如以下,不仅仅匹配单词,也把包含所有code的字符串也匹配了出来:

再精确一点,可以设置为大写,小写和忽略大小写,或者是只匹配单词: \bcode\b

现在的检测结果为:

 

元字符

类似于\b这种的,功能为匹配单词的开始或结束。它的同类还有很多,称之为元字符

比如 "."  除了换行符以外的任意字符

 

再比如"*" 可以连续重复使用任意次,和上面的结合在一起,就是 任意数量的不包含换行的字符

 

 或者是“\w” 匹配字母或数字或下划线或汉字

不要看到word想到是单词,其实它的功能如下面的文字描述:

\w matches any word character (equal to [a-zA-Z0-9_])

 

还有匹配空白符的\s

 

如果只需要匹配数字,那么需要"\b"

 

添加结束和开始符号 "^" "$"

 

 可能我们需要多次匹配,那么需要重复使用这些符号

* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次

其实还有很多的元字符,但完全是不用死记硬背的:https://www.w3cschool.cn/zhengzebiaodashi/regexp-metachar.html

posted @ 2018-09-30 15:37  樱花落舞  阅读(176)  评论(0编辑  收藏  举报