RegExp 随笔
以字面量定义正则表达式
var expression = /pattern/ flags;
pattern 部分可以是任何简单或复杂的正则表达示
flage 标明正则表达式的行为 1.g:全局模式,不会在发现第一个匹配项后停止 2.i:不区分大小写模式 3.m:多行模式
例:
var pattern1 = /at/g; //匹配字符串中所有at var pattern2 = /[bc]at/i; //匹配第一个“bat”或“cat”,不区分大小写 var pattern3 = /.at/gi; //全局匹配以“结尾”的三个字符。不区分小写
模式中使用的所有元字符都必须转义。正则表达式中的元字符包括:([{\^$|?*+.}])
例:
var pattern4 = /\[bc\]at/i; //匹配第一个“[bc]at”,不区分大小写
使用RegExp构造函数,接受2个参数,参数1:要匹配的字符串模式,参数2:可选的标志行为
例:
var pattern5 = new RegExp("[bc]at", "i");
注:因为RegExp构造函数的模式参数都是字符串,所以在某些情况下要对字符串进行双重转义。所有元字符必须双重转义
例:
字面量 等价字符串
/\[bc\]at/ "\\[bc\\]at"
/\.at/ "\\.at"
/name/\age/ "name\\/age"
/\d.\d{1,2}/ "\\d.\\d{1,2}"
/\w\\hello\\123/ "\\w\\\\hello\\\\123"
注:使用字面量和实例化创建正则表达式不一样,字面量始终会共享同一个RegExp实例(ECMAScript3)。使用构造函数创建的每一个新的RegExp实例都是一个新实例。
RegExp实例属性
console.log(pattern5.global); //false 是否设置了g标志 console.log(pattern5.ignoreCase); //true 是否设置了i标志 console.log(pattern5.multiline); //false 是否设置了m标志 console.log(pattern5.lastIndex); //0 开始搜索下一个匹配项的起始位置 console.log(pattern5.source); //[bc]at 正则表达式的字符串表示
继承属性
console.log(pattern5.toString()); // /[bc]at/i 正则表达式的字面量表示 console.log(pattern5.toLocaleString()); // /[bc]at/i 正则表达式的字面量表示 console.log(pattern5.valueOf()); // /[bc]at/i 正则表达式的字面量表示
RegExp实例方法
方法一:exec(),接受一个参数,既应用模式字符串。返回返回包含第一个匹配项信息的数组,在没有的情况下返回null,返回的数组实例包含两个属性index(匹配项在字符中的位置)和input(应用正则的字符串)。
var text = "huang jin liang shi ge hao ren"; var pattern6 = new RegExp("huang( jin liAng( shi ge hao ren)?)?", "i"); var matches = pattern6.exec(text); console.log(matches); //[ 'huang jin liang shi ge hao ren', // ' jin liang shi ge hao ren', // ' shi ge hao ren', // index: 0, // input: 'huang jin liang shi ge hao ren' ] var text1 = "cat, bat, sat"; var pattern7 = new RegExp(".at") var matches1 = pattern7.exec(text1); console.log(matches1); //cat var pattern8 = new RegExp(".at", "gm"); var matches2 = pattern8.exec(text1); console.log(matches2); //cat var matches3 = pattern8.exec(text1); console.log(matches3); //bat var matches4 = pattern8.exec(text1); console.log(matches4); //sat var matches5 = pattern8.exec(text1); console.log(matches5); //null
方法二:test(),接受一个参数,既应用模式字符串。该模式与该参数匹配的情况下返回true,反之false
var text2 = "000-00-0000"; var pattern9 = new RegExp("\\d{3}-\\d{2}-\\d{4}"); console.log(pattern9.test(text2)) console.log(text2); if (pattern9.test(text2)) { console.log("匹配成功"); } else { console.log("匹配失败"); }
构造函数属性(某些浏览器不支持)
长属性名 短属性名 说明
input $_ 最近一次要匹配的字符串
lastMatch $& 最近一次匹配项
lastParen $+ 最近一次捕获组
leftContext $` input字符串中lastMatch之前的文本
multiline $* 布尔,是否是多行模式
rightContext $' input字符串中lastMatch之后的文本
$1~$9 分别用于存储第几个捕获组
在ECMAScript局限性
1.匹配字符串开始和结束的\A和\Z锚
2.向后查找
3.并集和交集类
4.原子组
5.Unicode支持(单个字符除外)
6.命名捕获组
7.s和x匹配模式
8.条件匹配
9.正则表达式注释