第二次学正则表达式 概念与元字符
什么是正则表达式?
有时候,我们查找某个文件,可能会使用 * ?等符号,这种叫做通配符。
正则表达式更为准确的去匹配(描述)你所需要的字符串。可以说它是记录文本规则的代码。
举例一个正则表达式
一个非常简单的正则:code
很明确的信息去匹配包含code的所有字符串
比如以下,不仅仅匹配单词,也把包含所有code的字符串也匹配了出来:
再精确一点,可以设置为大写,小写和忽略大小写,或者是只匹配单词: \bcode\b
现在的检测结果为:
元字符
类似于\b这种的,功能为匹配单词的开始或结束。它的同类还有很多,称之为元字符
比如 "." 除了换行符以外的任意字符
再比如"*" 可以连续重复使用任意次,和上面的结合在一起,就是 任意数量的不包含换行的字符
或者是“\w” 匹配字母或数字或下划线或汉字
不要看到word想到是单词,其实它的功能如下面的文字描述:
\w matches any word character (equal to [a-zA-Z0-9_])
还有匹配空白符的\s
如果只需要匹配数字,那么需要"\b"
添加结束和开始符号 "^" "$"
可能我们需要多次匹配,那么需要重复使用这些符号
* | 重复零次或更多次 |
+ | 重复一次或更多次 |
? | 重复零次或一次 |
{n} | 重复n次 |
{n,} | 重复n次或更多次 |
{n,m} | 重复n到m次 |
其实还有很多的元字符,但完全是不用死记硬背的:https://www.w3cschool.cn/zhengzebiaodashi/regexp-metachar.html