正则表达式(下)

 本部分主要承接上篇(http://www.cnblogs.com/ttcc/p/3959457.html),继续总结正则表达式的获取控制部分。

获取控制

正则表达式元字符是包含特殊含义的字符。它们有一些特殊功能,可以控制匹配模式的方式。反斜杠后的元字符将失去其特殊含义。

字符类:单个字符和数字

元字符/元符号

匹配情况

.

      匹配除换行符外的任意字符

[a-z0-9]

      匹配括号中的字符集中的任意字符

[^a-z0-9]

      匹配任意不在括号中的字符集中的字符

\d

      匹配数字

\D

      匹配非数字,同[^0-9]相同(\d的反义)

\w

      匹配字母和数字及_中任意一个字符

\W

      匹配非字母和数字及_中任意一个字符(\w的反      义)

                                                                                                                 

 

字符类:空白字符

元字符/元符号

匹配情况

\0

          匹配null字符

\b

          匹配空格字符

\f

          匹配进纸字符

\n

          匹配换行符

\r

          匹配回车字符

\t

          匹配制表符

\s

        匹配空白字符、空格、制表符和换行符

\S

          匹配非空白字符

 

字符类:锚字符

元字符/元符号

匹配情况

^

  行首匹配(从最开头开始匹配)

$

  行尾匹配

\A

  只有匹配字符串开始处

\b

  匹配单词边界,词在[]内时无效

\B

  匹配非单词边界

\G

  匹配当前搜索的开始位置

\Z

  匹配字符串结束处或行尾

\z

  只匹配字符串结束处

 

字符类:重复字符

元字符/元符号

匹配情况

x?

匹配0个或1个x

x*

匹配0个或任意多个x

x+

匹配至少一个x

(xyz)+

匹配至少一个(xyz)

x{m,n}

匹配最少m个、最多n个x(注:{m}表示必须m个;{m,}表示m个或m个以上)

 

字符类:替代字符

元字符/元符号

匹配情况

this|where|logo

匹配this或where或logo中任意一个

 

 

字符类:记录字符

元字符/元符号

匹配情况

(string)

用于反向引用的分组

\1或$1

匹配第一个分组中的内容

\2或$2

匹配第二个分组中的内容

\3或$3

匹配第三个分组中的内容

 

/*使用点元字符*/

var pattern = /g..gle/;                                        //.匹配一个任意字符

var str = 'google';

alert(pattern.test(str));

 

/*重复匹配*/

var pattern = /g.*gle/;                                       //.匹配0个一个或多个

var str = 'google';                                              //*,?,+,{n,m}

alert(pattern.test(str));

 

/*使用字符类匹配*/

var pattern = /g[a-zA-Z_]*gle/;                          //[a-z]*表示任意个a-z中的字符

var str = 'google';

alert(pattern.test(str));

 

var pattern = /g[^0-9]*gle/;                               //[^0-9]*表示任意个非0-9的字符

var str = 'google';

alert(pattern.test(str));

 

var pattern = /[a-z][A-Z]+/;                               //[A-Z]+表示A-Z一次或多次

var str = 'gOOGLE';

alert(pattern.test(str));

 

/*使用元符号匹配*/

var pattern = /g\w*gle/;                                     //\w*匹配任意多个所有字母数字_

var str = 'google';

alert(pattern.test(str));

 

var pattern = /google\d*/;                                  //\d*匹配任意多个数字                     

var str = 'google444';

alert(pattern.test(str));

 

var pattern = /\D{7,}/;                                      //\D{7,}匹配至少7个非数字     

var str = 'google8';

alert(pattern.test(str));

 

/*使用锚元字符匹配*/

var pattern = /^google$/;                    //^从开头匹配,$从结尾开始匹配,开头结尾必须都是google

var str = 'google';

alert(pattern.test(str));

 

var pattern = /goo\sgle/;                        //\s可以匹配到空格            

var str = 'goo gle';

alert(pattern.test(str));                            //true

 

var pattern = /google\b/;                       //\b可以匹配是否到了边界               

var str = 'google';

alert(pattern.test(str));

 

/*使用或模式匹配*/

var pattern = /google|baidu|bing/;               //匹配三种其中一种字符串

var str = 'google';

alert(pattern.test(str));                           //true

 

/*使用分组模式匹配*/

var pattern = /(google){4,8}/;                 //匹配分组里的字符串4-8次(分组相当于一个字符)

var str = 'googlegoogle';

alert(pattern.test(str));                    //false

 

var pattern = /8(.*)8/;                        //获取8..8之间的任意字符

var str = 'This is 8google8';

str.match(pattern);                                           

alert(RegExp.$1);               //得到第一个分组里的字符串内容(前提是运行一下),这儿是:google

 

var pattern = /8(.*)8/;   

var str = 'This is 8google8';

var result = str.replace(pattern,'<strong>$1</strong>');              //得到替换的字符串输出

document.write(result);                                    

 

var pattern = /(.*)\s(.*)/;

var str = 'google baidu';

var result = str.replace(pattern, '$2 $1');                             //将两个分组的值替换输出

document.write(result);                                              //baidu google

 

贪婪问题:

贪  婪

惰  性

+

+?

?

??

*

*?

{n}

{n}?

{n,}

{n,}?

{n,m}

{n,m}?

 

 

/*关于贪婪和惰性*/

var pattern = /[a-z]+?/;                        //?号关闭了贪婪匹配,只替换了第一个,否则用贪婪下面的都会变为xxx。。。。。

var str = 'abcdefjhijklmnopqrstuvwxyz';

var result = str.replace(pattern, 'xxx');

alert(result);

 

//禁止了贪婪,开启的全局(下面三段代码好好理解!)

var pattern = /8(.*)8/;                                                                            //使用了贪婪

var str = '8google8 8google8 8google8';                   //匹配到了google8 8google8 8google

document.write(str.replace(pattern, '<strong>$1</strong>'));    //结果:<strong>google8 8google8 8google</strong>

 

var pattern = /8(.*?)8/g;                                                          //使用了惰性,开启全局

var str = '8google8 8google8 8google8';      

document.write(str.replace(pattern, '<strong>$1</strong>'));

//这次结果正确了

//<strong>google</strong>

//<strong>google</strong>

//<strong>google</strong>

 

var pattern = /8([^8]*)8/g;                                              //另一种禁止贪婪(屏蔽掉8)

var str = 'This is 8google8, That is 8google8, There is 8google8';

var result = str.replace(pattern,'<strong>$1</strong>');

document.write(result); 

 

/*使用exec返回数组*/

var pattern = /^[a-z]+\s[0-9]{4}$/i;

var str = 'google 2012';

alert(pattern.exec(str));                                                  //返回整个字符串

 

var pattern = /^[a-z]+/i;                                                //只匹配字母

var str = 'google 2012';

alert(pattern.exec(str));                                                 //返回google

 

var pattern = /^([a-z]+)\s([0-9]{4})$/;                      //使用了分组

var str = 'google 2012';

var a = pattern.exec(str);      

//alert(a.length);           //3

//alert(a[0]);                                         //a[0],返回匹配到的整个字符串google 2012

//alert(a[1]);                                         //a[1],返回匹配到的第一个分组的字符串google

//alert(a[2]);                                         //a[2],返回匹配到的第二个分组的字符串2012

 

var pattern = /(\d+)([a-z])/;             //这个叫做捕获性分组,所有的分组都捕获返回

var str = '123abc';

var a = pattern.exec(str);

//a[0]返回123a

//a[1]返回123

//a[2]返回a

 

var pattern = /(\d+)(?:[a-z])/;        //非捕获性分组,只要在不需要捕获返回的分组加上?:

var str = '123abc';

alert(pattern.exec(str));

 

/*使用分组嵌套*/

var pattern = /(a?(b?(c?)))/;          //嵌套分组,从外往内获取

var str = 'abc';

alert(pattern.exec(str));

//第一步:a[0],整个匹配到的字符串abc

//第二步:a[1],匹配第一个分组(a?(b?(c?))),  abc

//第三步:a[2],匹配第二个分组(b?(c?), bc

//第三步:a[3],匹配第三个分组(c?), c

 

/*使用前瞻捕获*/

var pattern = /(goo(?=gle))/;                              //goo后面必须跟着gle才能捕获goo

var str = 'google';

alert(pattern.exec(str));                          //注意这儿返回的是goo

 

/*使用特殊字符匹配*/

var pattern = /\.\[\/b\]/;                                      //特殊字符,用\符号转义即可

var str = '.[/b]';

alert(pattern.test(str));

 

/*使用换行模式*/

var pattern = /^\d+/mg;                                     //启用了换行模式

var str = '1.baidu\n2.google\n3.bing';

var result = str.replace(pattern, '#');

alert(result);

 

For my lover, CC !

Thank you, Mr Lee !

 

posted @ 2014-09-07 09:31  努力就有机会  阅读(923)  评论(0编辑  收藏  举报