简单正则表达式笔记
正则表达式
一直使用简单的正则表达式,遇到难点的就无法简洁高效的写出正则,故此整理一篇需要记忆应用的正则使用。
正则表达式作用
- 匹配一个字符串的子字符串(子集),或者替换该字符串。
不得不提的String和reg的常用方法
-
codePointAt(pos) 方法:得到字符的码位。汉字可以得到完整的码位
-
fromCodePoint() 方法:参数提供字符的码位返回对应的字符
-
include() 方法: 如果检测到指定文本就返回true,否则返回false。接受第二个参数为开始搜索的指定索引值
-
startsWith() 方法: 如果在起始位置检测到指定文本就返回true,否则返回false。接受第二个参数为开始搜索的指定索引值
-
endsWith() 方法: 从字符串末尾往前匹配。如果在结束部分检测到指定文本返回true,否则返回false。接受第二个参数为开始搜索的指定索引值
-
repeat()方法:
"o".repeat(3) // ooo
表示重复某个字符串指定次数 -
reg.test(str)方法: test()方法执行一个检索,用来查看正则表达式在指定的字符串(str)中是否能被匹配。返回 true 或 false。
-
reg.exec(str)方法: 方法在一个指定字符串中执行一个搜索匹配。找到返回一个结果数组或未找到 null。 返回的数组将完全匹配成功的文本作为第一项,将正则括号里匹配成功的作为数组填充到后面
- 全局调用和非全局调用:全局调用时,在匹配后,它将把RegExp实例的lastIndex属性设置为匹配文本的最后一个字符的下一个位置,当 exec() 再也找不到匹配的文本时,它将返回null,并把lastIndex属性重置为0
-
str.search(reg)方法: 执行正则表达式和 String对象之间的一个搜索匹配。如果匹配成功,则 search() 返回正则表达式在字符串中首次匹配项的索引,否则,返回 -1。与上面的reg.test()类似可判断是否存在某个正则模式
-
search() 方法不执行全局匹配,它将忽略标志g,它同时忽略正则表达式对象的lastIndex属性,并且总是从字符串的开始进行检索,这意味着它总是返回字符串的第一个匹配的位置
-
如果传入一个非正则表达式对象,则会使用 new RegExp(obj) 隐式地将其转换为正则表达式对象。
-
-
str.match(reg)方法: 当一个字符串与一个正则表达式匹配时, match()方法检索匹配项。
-
参数:如果传入一个非正则表达式对象,则会隐式地使用 new RegExp(obj) 将其转换为一个reg
-
参数:如果你未提供任何参数,直接使用 match() ,那么你会得到一个包含空字符串的 Array :[""] 。
-
返回值:如果字符串匹配到了表达式,会返回一个数组,数组的第一项是进行匹配完整的字符串,之后的项是用圆括号捕获的结果。如果没有匹配到,返回null
-
全局调用:全局匹配返回的数组的内容与非全局大不相同,它的数组元素中存放的是字符串中所有的匹配子串,而且也没有index属性或input属性
-
非全局调用:只在字符串中匹配依次,若没有匹配到文本,match()返回null,匹配到返回一个数组,数组中第一个元素存放匹配到的文本,其余的元素存放的是与正则表达式的子表达式匹配的文本,数组具有两个属性,index ( 匹配文本的起始字符在字符串位置 )和 input属性
-
-
String.prototype.replace(reg, function): 是将匹配内容应用函数后返回一个新字符串。
-
String.prototype.split(reg): 以指定的分隔符字符串将一个String对象分割成字符串数组, 如果分隔符是
("")
则会每个字符都切割。- 注意:当字符串为空时,split()返回一个包含一个空字符串的数组,而不是一个空数组,如果字符串和分隔符都是空字符串,则返回一个空数组。
-
Array.prototype.join()方法: join() 方法将一个数组(或一个类数组对象)的所有元素连接成一个字符串并返回这个字符串,不改变原数组。
- 参数: 指定一个字符串将数组的每一个元素以这个字符串拼接,
()
为空默认为,
当("")
是引号时则元素之间没有任何字符。这个方法常常和String.prototype.split()连用
- 参数: 指定一个字符串将数组的每一个元素以这个字符串拼接,
一些常用的匹配字符
预定义类
字符集 | 等价于 | |
---|---|---|
. | [ ^ \r\n ] | 除了换行和回车符之外所有字符 |
\d | [ 0-9 ] | |
\D | [ ^ 0-9 ] | |
\s | [ \t\v\n\r ] | 包含制表符、空格、垂直制表符 |
\S | [ ^ \t\v\n\r ] | |
\w | [a-zA-Z ] | |
\W | [ ^ a-zA-Z ] |
量词
重复修饰符 | 描述 | 示例 |
---|---|---|
指定n 次 | /\d{5}/数字出现5次 | |
最少n次 | /\d{5,}/数字至少出现5次 | |
n值m次 | ||
? | 最多一次, | |
+ | 最少一次 | |
* | re次 |
边界字符集
字符 | 含义 |
---|---|
^ | 以 xxx开头 |
$ | 以 xxx结尾 |
\b | 单词边界 |
\B | 非单词边界 |
正则语法
构造方式
const re1 = /\d/
字面量语法 创建const re2 = new RegExp(\d)
构造函数 创建
使用正则搜索
str = "It will rain tomorrow"
//字符串在前
str.startWith("will") //true
str.endsWith("will") //true
str.includes("will") //true
str.match(/\w{3,}/g) // will rain tomorrow
str.search(/\w{3,}/g) // 3
//正则表达式在前
/\w{3,}/g.test(str) //true
....
常用用法
- 常用修饰符
g:global,全文搜索,不添加的话搜索到第一个结果停止搜索
i:ingore case,忽略大小写,默认大小写敏感
m:multiple lines,多行搜索
-
\D 和 \S \W
常用来去除不想要的 -
\D
可用来去除不是数字的的字符比如: var yourNumber = 'phoneNumber15555555555' var number.replace(/\D/,'')
-
\S
可用来确保必填字段中字符var username = ' daixixi ' var value = /\S/.test(username)
-
各种修饰符时修饰前一个元素出现的次数
var a = "hello world2hello china".match(/\w+/)
-
.
匹配除了换行和回车符之外字符,可以使用[/\s\S/]
匹配所有字符 -
分组 : 当某一个修饰符对前一个元素进行影响时,若想对一组有作用则使用分组
/(ab)+/ 匹配至少一组连续的ab
-
或: 使用竖线表示或,
/a|b/ 表示匹配a或b
(有个笑话就是这个|
写成中文的丨怎么都查不出。。。) -
取反 :有限字符集以外的字符
/[^abc]/ 除abc以外字符
-
范围: 使用
[a-z] 表示a到z 之间任意一个
-
字符类:使用
[]
来构建一个简单的类,/[abc]/ 表示匹配其中任意一个均可
-
贪婪模式和非贪婪模式: 在设置了量词后匹配是默认是贪婪模式会即以最大的量词进行匹配,不过在量词后面加上
?
后就可以取最小量词进行匹配,是否匹配结束一般取决于是否加g
'123456789'.match(/\d{3,5}/g); //["12345", "6789"] '123456789'.match(/\d{3,5}?/g); //["123", "456", "789"]
-
分组嵌套:
var str = '<a href="http://a.com">"网址"</a>' var reg = /href="((https?:)?\/\/.+?)"/ console.log(str.match(reg)) var url = str.match(reg)[1]
-
前瞻:
表达式 | 含义 |
---|---|
exp1(?=exp2) | 匹配后面是exp2的exp1 |
exp1(?!exp2) | 匹配后面不是exp2的exp1 |
得到是exp1的值,不过需要满足条件才会被匹配中