详解JS正则replace的使用方法
在讲replace的高级应用之前,我们先简单梳理一下JS正则中的几个重要的知识点,以帮助你对基础知识的回顾,然后再讲解JS正则表达式在replace中的使用,以及常见的几个经典案例。
一、正则表达式的创建
JS正则的创建有两种方式: new RegExp() 和 直接字面量。
1
2
3
4
5
|
//使用RegExp对象创建 var regObj = new RegExp( "(^\s+)|(\s+$)" , "g" ); //使用直接字面量创建 var regStr = /(^\s+)|(\s+$)/g; |
其中 g 表示全文匹配,与之相关的还有 i 和m,i 表示匹配时忽略大小写,m 表示多行匹配,如果多个条件同时使用时,则写成:gmi
二、()、[]、{} 的区别
() 的作用是提取匹配的字符串。表达式中有几个()就会得到几个相应的匹配字符串。比如 (\s+) 表示连续空格的字符串。
[]是定义匹配的字符范围。比如 [a-zA-Z0-9] 表示字符文本要匹配英文字符和数字。
{}一般用来表示匹配的长度,比如 \d{3} 表示匹配三个空格,\d[1,3]表示匹配1~3个空格。
三、^ 和 $
^ 匹配一个字符串的开头,比如 (^a) 就是匹配以字母a开头的字符串
$ 匹配一个字符串的结尾,比如 (b$) 就是匹配以字母b结尾的字符串
^ 还有另个一个作用就是取反,比如[^xyz] 表示匹配的字符串不包含xyz
需要注意的是:如果^出现在[]中一般表示取反,而出现在其他地方则是匹配字符串的开头
四、\d \s \w .
\d 匹配一个非负整数, 等价于 [0-9]
\s 匹配一个空白字符
\w 匹配一个英文字母或数字,等价于[0-9a-zA-Z]
. 匹配除换行符以外的任意字符,等价于[^\n]
五、* + ?
* 表示匹配前面元素0次或多次,比如 (\s*) 就是匹配0个或多个空格
+ 表示匹配前面元素1次或多次,比如 (\d+) 就是匹配由至少1个整数组成的字符串
? 表示匹配前面元素0次或1次,相当于{0,1} ,比如(\w?) 就是匹配最多由1个字母或数字组成的字符串
六、test 、match
前面的大都是JS正则表达式的语法,而test则是用来检测字符串是否匹配某一个正则表达式,如果匹配就会返回true,反之则返回false
1
2
3
|
/\d+/.test( "123" ) ; //true /\d+/.test( "abc" ) ; //false |
match是获取正则匹配到的结果,以数组的形式返回
"186a619b28".match(/\d+/g); // ["186","619","28"]
以上基本上是我经常用到的基础知识,不是很全面,不常用的就没有列出来,因为列出来也只是摆设,反而混淆主次!
七、replace
replace 本身是JavaScript字符串对象的一个方法,它允许接收两个参数:
replace([RegExp|String],[String|Function])
第1个参数可以是一个普通的字符串或是一个正则表达式
第2个参数可以是一个普通的字符串或是一个回调函数
如果第1个参数是RegExp, JS会先提取RegExp匹配出的结果,然后用第2个参数逐一替换匹配出的结果
如果第2个参数是回调函数,每匹配到一个结果就回调一次,每次回调都会传递以下参数:
1
2
3
4
5
6
7
|
result: 本次匹配到的结果 $1,...$9: 正则表达式中有几个(),就会传递几个参数,$1~$9分别代表本次匹配中每个()提取的结果,最多9个 offset:记录本次匹配的开始位置 source:接受匹配的原始字符串 |
以下是replace和JS正则搭配使用的几个常见经典案例:
(1)实现字符串的trim函数,去除字符串两边的空格
1
2
3
4
5
6
7
8
9
10
|
String.prototype.trim = function (){ //方式一:将匹配到的每一个结果都用""替换 return this .replace(/(^\s+)|(\s+$)/g, function (){ return "" ; }); //方式二:和方式一的原理相同 return this .replace(/(^\s+)|(\s+$)/g, '' ); }; |
^\s+ 表示以空格开头的连续空白字符,\s+$ 表示以空格结尾的连续空白字符,加上() 就是将匹配到的结果提取出来,由于是 | 的关系,因此这个表达式最多会match到两个结果集,然后执行两次替换:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
String.prototype.trim = function (){ /** * @param rs:匹配结果 * @param $1:第1个()提取结果 * @param $2:第2个()提取结果 * @param offset:匹配开始位置 * @param source:原始字符串 */ this .replace(/(^\s+)|(\s+$)/g, function (rs,$1,$2,offset,source){ //arguments中的每个元素对应一个参数 console.log(arguments); }); }; " abcd " .trim(); 输出结果: [ " " , " " , undefined, 0, " abcd " ] //第1次匹配结果 [ " " , undefined, " " , 5, " abcd " ] //第2次匹配结果 |
(2)提取浏览器url中的参数名和参数值,生成一个key/value的对象
1
2
3
4
5
6
7
8
9
10
11
|
function getUrlParamObj(){ var obj = {}; //获取url的参数部分 var params = window.location.search.substr(1); //[^&=]+ 表示不含&或=的连续字符,加上()就是提取对应字符串 params.replace(/([^&=]+)=([^&=]*)/gi, function (rs,$1,$2){ obj[$1] = $2; }); return obj; } |
/([^&=]+)=([^&=]*)/gi 每次匹配到的都是一个完整key/value,形如 xxxx=xxx, 每当匹配到一个这样的结果时就执行回调,并传递匹配到的key和value,对应到$1和$2
(3)在字符串指定位置插入新字符串
1
2
3
4
5
6
7
8
9
10
|
String.prototype.insetAt = function (str,offset){ //使用RegExp()构造函数创建正则表达式 var regx = new RegExp( "(.{" +offset+ "})" ); return this .replace(regx, "$1" +str); }; "abcd" .insetAt( 'xyz' ,2); //在b和c之间插入xyz >> "abxyzcd" |
当offset=2时,正则表达式为:(^.{2}) .表示除\n之外的任意字符,后面加{2} 就是匹配以数字或字母组成的前两个连续字符,加()就会将匹配到的结果提取出来,然后通过replace将匹配到的结果替换为新的字符串,形如:结果=结果+str
(4) 将手机号12988886666转化成129 8888 6666
1
2
3
4
5
6
7
8
9
10
11
12
|
function telFormat(tel){ tel = String(tel); //方式一 return tel.replace(/(\d{3})(\d{4})(\d{4})/, function (rs,$1,$2,$3){ return $1+ " " +$2+ " " +$3 }); //方式二 return tel.replace(/(\d{3})(\d{4})(\d{4})/, "$1 $2 $3" ); } |
(\d{3}\d{4}\d{4}) 可以匹配完整的手机号,并分别提取前3位、4-7位和8-11位,"$1 $2 $3" 是在三个结果集中间加空格组成新的字符串,然后替换完整的手机号。
(5) 实现函数escapeHtml,将<, >, &, " 进行转义
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
function escapeHtml(str) { //匹配< > " & return str.replace(/[<>"&]/g, function (rs) { switch (rs) { case "<" : return "<" ; case ">" : return ">" ; case "&" : return "&" ; case "\"" : return """ ; } }); } |
以上就是本文的全部内容,希望对大家的学习有所帮助。
replace 传参示例:
let transformMobile = mobile => { //手机号码隐藏中间4位,特殊手机港澳台手机号也适用 if (mobile) { const reg = /^(\d{3})(\d{1,})(\d{4})$/ // return mobile.replace(reg, '$1****$2') return mobile.toString().replace(reg, function($, $1, $2, $3){ let len = $2.replace(/\w/g, '*') return `${$1}${len}${$3}` }) } else { return mobile } }; // $ 第一个参数是mobile本身 // $1 返回第一个匹配到的子集 // $2 返回第二个匹配到的子集 // ...