正则表达式
正则表达式- 元字符
符号 | 描述 | 表达式(示例) | 匹配实例 |
---|---|---|---|
\b | 匹配一个单词边界 | \bhi\b | hi |
\B | 匹配一个单词非边界 | \Bhi\B | this |
\d | 匹配一个数字字符 | \d | 123 45 |
\D | 匹配一个非数字字符 | \D | a A @ —_ |
\w | 匹配数字/字母/下划线 | \w | 123 45 abc_ |
\W | 匹配非数字/字母/下划线 | \W | @#$% |
^ | 字符串开头 | ^hi | hi him hidden |
$ | 字符串结束 | hi$ | hi chi orochi |
[] | 匹配指定一堆字符中的一个 | ^[a-z]at$ | cat mat zat |
^[A-Za-z]at$ | Cat cat Mat | ||
^[aeiou]at$ | aat cat uat | ||
[^] | 不匹配指定集合中任何一个字符 | [xyz]at$ | 不能匹配 xat yat zat |
+ | 前一模式可以被重复1次或n次 | ^go+gle | gogle google goooooogle |
^g[aeiou]+gle$ | gogle gegle geagle gaeiougle | ||
* | 前一模式可以被重复0次或n次 | ^go*gle | ggle google goooooogle |
^g[aeiou]*gle$ | ggle gegle geagle gaeiougle | ||
? | 前一模式可以被重复0次或1次 | ^go?gle | ggle gogle |
前一模式可以被重复x次 | ^go{2}gle$ | ||
前一模式可以被重复x到y次 | ^go{2,4}gle$ | google gooogle goooogle | |
前一模式可以被重复至少x次 | ^go{2,}gle$ | google gooogle gooooooooogle | |
() | 可以指定一堆字符匹配一个模式,分组 | ^(very )*large$ | large very large very very large very very very very large |
| | 指定几个规则只要匹配一个即可匹配(逻辑或) | ^abc-(com|org|net)$ | abc-com abc-org abc-net |
|匹配"[""^""+"")"等有特殊含义的字符,可以用“\”做转义 | ^1*(2+3)=6$ | 1*(2+3)=6 | |
. | 匹配除换行符 \n 之外的任何单字符 | ^<.*>$ | <h1>正则表达式</h1> |
\cx | 匹配由x指明的控制字符。例如, \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则,将 c 视为一个原义的 'c' 字符 | ||
\f | 匹配一个换页符。等价于 \x0c 和 \cL | ||
\n | 匹配一个换行符。等价于 \x0a 和 \cJ | ||
\r | 匹配一个回车符。等价于 \x0d 和 \cM | ||
\s | 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。注意 Unicode 正则表达式会匹配全角空格符 | ||
\S | 匹配任何非空白字符。等价于 [^ \f\n\r\t\v] | ||
\t | 匹配一个制表符。等价于 \x09 和 \cI | ||
\v | 匹配一个垂直制表符。等价于 \x0b 和 \cK |
JavaScript正则表达式修饰符
修饰符 | 描述 |
---|---|
i | 执行对大小写不敏感的匹配 |
g | 执行全局匹配(查找所有匹配而非在找到第一个匹配后停止) |
m | 执行多行匹配 |
常用正则表达式
- 中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
- 中文字符的正则表达式:[\u4e00-\u9fa5]
- 非负整数:^\d+$ 或 ^[1-9]\d*|0$
- Email地址:^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$
- 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+.?
- 国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d
- 身份证号(15位、18位数字),最后一位是校验位,可能为数字或字符X:(\d{15}$)|(\d{18}$)|(^\d{17}(\d|X|x)$)
- 帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
- 强密码(必须包含大小写字母和数字的组合,可以使用特殊字符,长度在8-10之间):^(?=.\d)(?=.[a-z])(?=.*[A-Z]).{8,10}$
- 日期格式:^\d{4}-\d{1,2}-\d
- xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]$
- 双字节字符:[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))
- HTML标记:<\s(\S+)(\s[^>])?>[\s\S]<\s/\1\s*>
- URL:(\w+)😕/([/:]+)(:\d*)?([# ]*)
- IP地址:((?😦?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d))
- 中国邮政编码:[1-9]\d{5}(?!\d)
本文参考文档:
作者:德乌姆列特
本博客所有文章仅用于学习、研究和交流目的,欢迎非商业性质转载。
博主的文章没有高度、深度和广度,只是凑字数。由于博主的水平不高,不足和错误之处在所难免,希望大家能够批评指出。
博主是利用读书、参考、引用、抄袭、复制和粘贴等多种方式打造成自己的文章,请原谅博主成为一个无耻的文档搬运工!