【JavaScript】最最详细的正则表达式总结

之前在刷leetcode的时候发现有很多问题都是通过正则表达式来解决的，所以有必要在对其进行总结，本文参考这篇文章
那么我们开始吧
文章目录

创建正则表达式

正则表达式用RegExp对象表示

1.直接量语法创建

就是我们经常看到的斜杠 “/”

2.对象构造函数创建

new RegExp(pattern[,flags])
RegExp(pattern[,flags])

pattern可以是字符串或者正则字面量，字符串的时候要用常规的字符转义规则，必须将\替换成\\
比如：/\w+/等价为new RegExp("\\w+")

直接量字符

在正则表达式中，有一些标点符号具有特殊含义，他们是：^ $ . * + ? = ! : | \ / ( ) [ ] { } 如果需要在正则表达式中与这些直接量进行匹配，必须使用前缀 \。没有“-”号

字符类

通过将直接量字符放入方括号内，可以组成字符类（character class）。一个字符类可以匹配它所包含任意一个字符。如 [abc] 可以匹配 a，b，c 中任意一个字符。注意！！！是任意一个

在这里插入图片描述

方括号内也可出现转义字符，如 [\d\s] 表示匹配任意空白符或数字。

重复

当一个模式需要被多次循环匹配的时候，正则表达式提供了表示重复的正则语法。

贪婪和非贪婪的重复

上面所有的重复都是“贪婪的”匹配，也就是匹配尽可能多的字符。如 /a+/ 匹配 'aaaa' 时，它会匹配 'aaaa'

注意：正则表达式的模式匹配总会寻找字符串中第一个可能匹配的位置，这意味这 /a+?b/ 匹配 'aaab' 时，匹配到的是 'aaab' 而不是 'ab'。

选择、分组和引用

选择

字符 | 用于分隔供选择的模式，匹配时会尝试从左到右匹配每一个分组，直到发现匹配项。如 /ab|bc|cd/ 可以匹配字符串'ab'、'bc' 和 'cd'。

分组

圆括号可以把单独的项组合成子表达式，以便可以像一个独立的单元用 |、*、+ 或者 ? 对单元内的项进行处理。

引用

带圆括号的表达式的另一个用途是允许在同一个正则表达式的后面引用前面的子表达式。通过\后面加数字实现。\n 表示第 n 个带圆括号的子表达式。表示引用前一个表达式所匹配的文本。因为子表达式可以嵌套，所以根据子表达式左括号的位置进行计数。

例，能匹配 1999-01-01 或 1999/01/01 的正则：/\d{4}([-\/])\d{2}\1\d{2}/
这里\1对第一个出现的括号子表达式进行了引用

具名引用

使用 (?<name>...) 的语法来为分组命名，并通过 \k<name> 在后面的正则表达式中引用。

如例，能匹配 1999-01-01 或 1999/01/01 的正则：/\d{4}(?<separator>[-\/])\d{2}\k<separator>\d{2}/

忽略引用

如果只想用圆括号来表示子表达式，而不希望生成引用，可以使用 (?😃 来进行分组。例，/(?:a)(?:b)(c)/ 中 \1 将表示 (c) 所匹配的文本。

指定匹配位置（锚元素）

正则表达式中的锚字符包括：

^ 用来匹配字符串的开始，多行检索时匹配一行的开头。
$ 用来匹配字符串的结束，多行检索时匹配一行的结尾。
\b 用来匹配单词的边界，就是 \w 和 \W 之间的位置，或者 \w 和字符串的开头或结尾之间的位置。
\B 匹配非单词边界的位置。

例： /\bJava\b/ 可以匹配 Java 却不匹配 JavaScript。

任意正则表达式都可以作为锚点条件。

先行断言

(?=pattern)
如 /\d+(?=%)/ 匹配字符串 '100%' 中的 '100' 但是不匹配 '100。'

负向先行断言

反向匹配

后行断言

(?<=pattern)
如/(?<=\$)\d+/ 匹配 '$100' 但是不匹配 '￥100'

负向后行断言

修饰符（/后面的选择项）

i 执行不区分大小写的匹配。
g 全局匹配。
m 多行匹配模式。
y “粘连”（sticky）修饰符。y修饰符的作用与g修饰符类似，也是全局匹配，后一次匹配都从上一次匹配成功的下一个位置开始。不同之处在于，g修饰符只要剩余位置中存在匹配就可，而y修饰符确保匹配必须从剩余的第一个位置开始，这也就是“粘连”的涵义。
s 表示点（.）可以表示任意字符，不设置的话，四个字节的 UTF-16 字符和行终止符不能用 . 表示。
u 开启 “Unicode 模式”，用来正确处理大于 \uFFFF 的 Unicode 字符。也就是说，会正确处理四个字节的 UTF-16 编码。

通过 RegExp.prototype.flags 可以获得正则修饰符的字符串。/pattern/ig.flags 返回 "gi"

正则表达式对象的原型方法

String.prototype.search(regexp|substr)

返回第一个和参数匹配的子串的起始位置。没有匹配子串返回 -1 。

如果参数不是正则表达式，将会通过 RegExp 构造函数转换成正则表达式。它会忽略正则的修饰符 g。

String.prototype.replace(regexp|substr, newSubStr|function)

第一个参数同search，查找指定子串。如果第二个表达式是字符串，将把第一个参数匹配的子串替换为 newSubStr。如果在替换字符串中出现了 $ 加数字，replace 将用与指定的子表达式相匹配的文本来替换这些字符。

例，单书名号包裹文本改为书名号。'<JavaScript>和<正则表达式>'.replace(/<([^_]*?)>/g, '《$1》') 会得到 "《JavaScript》和《正则表达式》"

使用字符串作为参数时替换字符串可以插入下面的特殊变量名：

$$ 插入一个 “$”
$& 插入匹配的子串。
`$`` 插入当前匹配的子串左边的内容。
$’ 插入当前匹配的子串右边的内容。
$n 假如第一个参数是 RegExp对象，并且 n 是个小于100的非负整数，那么插入第 n 个括号匹配的字符串。提示：索引是从1开始

使用函数作为第二个参数

function replacer(match, p1, p2, p3, offset, string) { }
// match        匹配的子串。
// p1,p2, ...   假如replace()方法的第一个参数是一个RegExp 对象，则代表第n个括号匹配的字符串。
// offset       匹配到的子字符串在原字符串中的偏移量。子串首字母下标。
// string       被匹配的原字符串。

例，下划线命名转驼峰命名。'a_simple_name'.replace(/_([a-z])/g, (m, p1) => p1.toUpperCase()) 将得到 "aSimpleName"。

String.prototype.match(regexp)

参数 regexp 为一个正则表达式对象。如果传入一个非正则表达式对象，则会隐式地使用 new RegExp(obj) 将其转换为一个 RegExp 。

如果 regexp 没有设置修饰符 g，则仅返回第一个完整匹配及其相关的捕获组（Array），返回数组第一个字符是匹配字符串，余下的元素是正则表达式中圆括号括起来的子表达式。在这种情况下，返回的项目将具有如下所述的其他属性（groups: 一个捕获组数组或 undefined（如果没有定义命名捕获组）。index: 匹配的结果的开始位置。input: 搜索的字符串。），或者未匹配时返回 null 。

如果使用 g 标志，则将返回与完整正则表达式匹配的所有结果，但不会返回捕获组，或者未匹配时返回 null 。

'196.168.0.1'.match(/(\d+)(?=.|$)/) // (?=.|$) 先行匹配 匹配 . 或者字符串结尾
// (2) ["196", "196", index: 0, input: "196.168.0.1", groups: undefined]
'196.168.0.1'.match(/(?<num>\d+)(?=.|$)/) // (?<name>) 具名引用 见上文
// (2) ["196", "196", index: 0, input: "196.168.0.1", groups: {num: "196"}]
'196.168.0.1'.match(/\d+(?=.|$)/g)
// (4) ["196", "168", "0", "1"]

String.prototype.split([separator[, limit]])

separator 指定表示每个拆分应发生的点的字符串，可以是一个字符串或正则表达式。如果空字符串（""）被用作分隔符，则字符串会在每个字符之间分割。

limit 一个整数，限定返回的分割片段数量。

例，'张三;李四,王五|赵六'.split(/[;\|,]/) // (4) ["张三", "李四", "王五", "赵六"]

RegExp 的原型属性

flags 会返回正则表达式的修饰符。
表示对应修饰符是否存在的只读布尔值，global(表示是否带有修饰符 g)，ignoreCase （i），multiline（m），sticky（y），dotAll（s），unicode（u）
source 只读字符串，包含正则表达式的文本。
lastIndex 可读/写整数。如果带有 g 修饰符，这个属性存储在整个字符串中下一次检索的开始位置。这个属性会被 exec() 和 test() 方法用到。

RegExp 的方法

exec()

如果没有找到任何属性，将返回 null，如果找到匹配返回一个数组，该数组第一个元素是相匹配的字符串，余下的元素是与圆括号内的子表达式相匹配的子串。

当调用 exec() 的正则表达式具有修饰符 g 时，它将把当前正则表达式对象的 lastIndex 属性设置为紧挨着匹配子串的字符位置。

注意即使两次匹配的不是同一个字符串，lastIndex 还是会连续生效的。

let reg = /\d+/g;
reg.exec('25*10=250'); // ["25", index: 0, input: "25*10=250", groups: undefined]
reg.lastIndex; // 2
reg.exec('666'); // ["6", index: 2, input: "666", groups: undefined]
reg.lastIndex; // 3

test()

调用 test() 和 exec() 等价，当 exec() 返回结果不是 null，test() 返回 true，否则返回 false 。

String 的方法不会用到 lastIndex 属性。

常用的正则表达式

//（1）匹配 16 进制颜色值
var color = /#([0-9a-fA-F]{6}|[0-9a-fA-F]{3})/g;

//（2）匹配日期，如 yyyy-mm-dd 格式
var date = /^[0-9]{4}-(0[1-9]|1[0-2])-(0[1-9]|[12][0-9]|3[01])$/;

//（3）匹配 qq 号
var qq = /^[1-9][0-9]{4,10}$/g;

//（4）手机号码正则
var phone = /^1[34578]\d{9}$/g;

//（5）用户名正则
var username = /^[a-zA-Z\$][a-zA-Z0-9_\$]{4,16}$/;

//（6）Email正则
var email = /^([A-Za-z0-9_\-\.])+\@([A-Za-z0-9_\-\.])+\.([A-Za-z]{2,4})$/;

//（7）身份证号（18位）正则
var cP = /^[1-9]\d{5}(18|19|([23]\d))\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$/;

//（8）URL正则
var urlP= /^((https?|ftp|file):\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/;

// (9)ipv4地址正则
var ipP = /^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$/;

// (10)//车牌号正则
var cPattern = /^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领A-Z]{1}[A-Z]{1}[A-Z0-9]{4}[A-Z0-9挂学警港澳]{1}$/;

// (11)强密码(必须包含大小写字母和数字的组合，不能使用特殊字符，长度在8-10之间)：var pwd = /^(?=.\d)(?=.[a-z])(?=.[A-Z]).{8,10}$/

posted @ 2020-12-08 11:09 嗨Sirius 阅读(195) 评论(0) 收藏举报

刷新页面返回顶部

嗨Sirius