<JavaScript权威指南>读书笔记之正则表达式
一、定义
1 //正则表达式直接量 2 var regex = /s/; 3 //正则表达式对象RegExp 4 var regex = new RegExp('s');
二、特殊字符
正则表达式中许多标点符号具有特殊的含义:^$.*+?=!:|\/()[]{}。若想把它们当做普通字符处理,则需转义,即在这些符号之前加\
三、字符类
[...] 位于中括号内的任意字符
[^..] 不在中括号内的任意字符
. 除换行符和其他Unicode行终止符之外的任意字符
\w 任何ASCII单字符,等价于[a-zA-Z0-9_]
\W 任何非ASCII单字符,等价于[^a-zA-Z0-9_]
\s 任何Unicode空白符
\S 任何非Unicode空白符的字符
\d 任何ASCII数字,等价于[0-9]
\D 任何非ASCII数字,等价于[^0-9]
四、字符重复
{n,m} 匹配前一项至少n次,至多m次
{n,} 匹配前一项至少n次
{n} 匹配前一项至少n次
? 匹配前一项0次或1次,等价于{0,1}
* 匹配前一项至少0次,等价于{0,}
+ 匹配前一项至少1次,等价于{1,}
五、选择、分组、引用
| 选择。匹配的是该符号左边子表达式或右边子表达式。
(...) 组合。将几个项组合为一个单元,可供*、?、+和|等符号使用,还可记住和这组合匹配的字符以供此后的引用使用。
(?..) 只组合不引用。把几个项组合为一个单元,但不记忆于该组合匹配的字符
\n 和第n个分组第一次匹配的字符相匹配。组是括号中的子表达式。组号从左到右计数,以(?:)形式分组的组不编号。
例子
1 //选择 2 var regex = /ab|cd|ef/;//匹配ab或者cd或者ef 3 //分组 4 var regex = /java(script)?/;//匹配java,script可有可无 5 //引用 6 var regex = /(['"])[^'"]*\1/;//\1表示第一括号内的子模式。开始的引号和结尾的引号要相匹配,即开始是单引号则结尾也是单引号。 7 //只分组,不引用 8 var regex = /[Jj]ava(?:[Ss]cript)?/;//子表达式(?:[Ss]cript)仅用于分组,不会生成引用。所以\1在此子表达式无效。
六、锚字符
^ 匹配字符串的开头,在多行匹配时,匹配一行的开头。
$ 匹配字符串的结尾,在多行匹配时,匹配一行的结尾。
\b 匹配一个单词的边界,即是位于字符\w和\W之间的位置,或位字符\w和字符串的开头或结尾之间的位置。
\B 匹配非单词边界的位置
(?=p) 正前向声明,要求接下来的字符都与模式p匹配,但不包含匹配中的那些字符
(?!p) 反前向声明,要求接下来的字符不与模式p匹配。
例子
1 //选择 2 var regex = /ab|cd|ef/;//匹配ab或者cd或者ef 3 //分组 4 var regex = /java(script)?/;//匹配java,script可有可无 5 //引用 6 var regex = /(['"])[^'"]*\1/;//\1表示第一括号内的子模式。开始的引号和结尾的引号要相匹配,即开始是单引号则结尾也是单引号。 7 //只分组,不引用 8 var regex = /[Jj]ava(?:[Ss]cript)?/;//子表达式(?:[Ss]cript)仅用于分组,不会生成引用。所以\1在此子表达式无效。
posted on 2013-10-10 00:27 shiny_bender 阅读(220) 评论(0) 编辑 收藏 举报