javascript正则表达式

RegExp 对象

RegExp 对象表示正则表达式,它是对字符串执行模式匹配的强大工具。

直接量语法

/pattern/attributes

创建 RegExp 对象的语法:

new RegExp(pattern, attributes);

参数

参数 pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。在字符串中,regexp本来就是特殊字符。我们要是想使用就必须转义(“/”)!
 

参数 attributes 是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数。

*正则表达式有两种基本字符组成:

  1. 原义文本字符
  2. 元字符

 

*元字符是正则表达式中特有含义的非字母字符

这些符号有:^ $ . * +  - ? = ! : | \ / ( ) [ ] { }

1.“[ ]”表示字符类: 即括号里是个字符集,表示范围的:如/[abc]/,表示和含有a,b,c任何一个字母的字符串都匹配,在[]组成的类内部是可以连写的,如:[a-Za-z]。

注:特殊字符类:\s表示空格符、制表符、Unicode空白符。\S表示非Unicode空白符。(也可自定义Unicode字符类:如:

                        /[\u4E00-\u9FA5]/表示只匹配中文字符。)

                       \w 任何单字字符,相当于[a-zA-X0-9_];\W与\w相反。

                       \d 任何数字,相当于[0-9];\D与\w相反。

                       \b在字符类中使用表示退格符。[\b]则表示退格直接量。\b可以用来指定匹配位置,也可称为锚;如:

                      查找一个句子里的单词 java , 可以使用/\bjava\b/;\B与其相反。

2.“-"表示连字符,如[a-z];

3."."表示除换行符和其他Unicode行终止符之外的任意字符。

4."^"具有两重含义:开始标记和非,如:/^a/表示以a开始的字符,当在[]中时:/[^a]/表示非a的所有字符。

5."$"表示字符结尾。如:/^abc$/表示以c结束的字符。

6.”{}"表示重复上一项。如/\d{2,4}/表示数字出现两次,最多出现4次。如/3{2,4}/匹配33...;333....;3333.....;不匹配3和4个3相连以上的了。它的三种格式如下{n,m}表示至少3次,最多m次;{n,}至少n次;{n}恰好n次。

7."?"表示{0,1}。

8."+"表示{1,}。

9."*"表示{0,}。

注:非贪婪的重复(如??,+?,*?,{1,5}?只匹配第一个,只要在量词后面加上问号就可以了。)

10."|"表示分割,即或的含义。如:/ab|cd|ef/匹配含有ab或cd或ef的字符串。

11."()"包含三重用途:一是定义子表达式。二是在完整的模式中定义子模式。三是子表达式的引用。

子模式的定义可以从目标串中抽取和括号中的子模式相匹配的部分。

子模式的表达式的引用是指:可识别子模式的编号,提取它。如/(abc)\sis\s(string\w*)/;里面含有两个字表达式:可通过

\1指(abc);\2指(string\w*); 应用如:/['"][^'"]*['"]/不能取前后同样的引号,可以这样写:/[('")[^'"]*\1]/,可起到约束作用。

注:若想()里的不想被记忆,可采用(?:.....),将不会对其编号。

还有(?=p),(?!p)如下:

如/(javascript)?(?=\:)/ 表示匹配javascript:,但不包含:;它不匹配javascript,因为他有个条件就是后要接:;

(?!p)反前向声明,要求接下来的字符不与模式p匹配,与(?=p)相反。

12.分组:

 

 

反向引用:

 

前瞻:

 

 

 

 

 

 

正则表达式的方法:

RegExp.prototype.test()

---------------------------------------------------------------------------------------------------------------------------------

 

 

posted @ 2017-05-07 20:43  1O(∩_∩)O1  阅读(198)  评论(0编辑  收藏  举报