正则表达式（下）

本部分主要承接上篇（http://www.cnblogs.com/ttcc/p/3959457.html），继续总结正则表达式的获取控制部分。

获取控制

正则表达式元字符是包含特殊含义的字符。它们有一些特殊功能，可以控制匹配模式的方式。反斜杠后的元字符将失去其特殊含义。

字符类：单个字符和数字

元字符/元符号	匹配情况
.	匹配除换行符外的任意字符
[a-z0-9]	匹配括号中的字符集中的任意字符
[^a-z0-9]	匹配任意不在括号中的字符集中的字符
\d	匹配数字
\D	匹配非数字，同[^0-9]相同（\d的反义）
\w	匹配字母和数字及_中任意一个字符
\W	匹配非字母和数字及_中任意一个字符（\w的反　　　　　　义）

字符类：空白字符

元字符/元符号	匹配情况
\0	匹配null字符
\b	匹配空格字符
\f	匹配进纸字符
\n	匹配换行符
\r	匹配回车字符
\t	匹配制表符
\s	匹配空白字符、空格、制表符和换行符
\S	匹配非空白字符

字符类：锚字符

元字符/元符号	匹配情况
^	行首匹配（从最开头开始匹配）
$	行尾匹配
\A	只有匹配字符串开始处
\b	匹配单词边界，词在[]内时无效
\B	匹配非单词边界
\G	匹配当前搜索的开始位置
\Z	匹配字符串结束处或行尾
\z	只匹配字符串结束处

字符类：重复字符

元字符/元符号	匹配情况
x?	匹配0个或1个x
x*	匹配0个或任意多个x
x+	匹配至少一个x
(xyz)+	匹配至少一个(xyz)
x{m,n}	匹配最少m个、最多n个x（注：{m}表示必须m个；{m,}表示m个或m个以上）

字符类：替代字符

元字符/元符号	匹配情况
this\|where\|logo	匹配this或where或logo中任意一个

字符类：记录字符

元字符/元符号	匹配情况
(string)	用于反向引用的分组
\1或$1	匹配第一个分组中的内容
\2或$2	匹配第二个分组中的内容
\3或$3	匹配第三个分组中的内容

/*使用点元字符*/

var pattern = /g..gle/; //.匹配一个任意字符

var str = 'google';

alert(pattern.test(str));

/*重复匹配*/

var pattern = /g.*gle/; //.匹配0个一个或多个

var str = 'google'; //*,?,+,{n,m}

alert(pattern.test(str));

/*使用字符类匹配*/

var pattern = /g[a-zA-Z_]*gle/; //[a-z]*表示任意个a-z中的字符

var str = 'google';

alert(pattern.test(str));

var pattern = /g[^0-9]*gle/; //[^0-9]*表示任意个非0-9的字符

var str = 'google';

alert(pattern.test(str));

var pattern = /[a-z][A-Z]+/; //[A-Z]+表示A-Z一次或多次

var str = 'gOOGLE';

alert(pattern.test(str));

/*使用元符号匹配*/

var pattern = /g\w*gle/; //\w*匹配任意多个所有字母数字_

var str = 'google';

alert(pattern.test(str));

var pattern = /google\d*/; //\d*匹配任意多个数字

var str = 'google444';

alert(pattern.test(str));

var pattern = /\D{7,}/; //\D{7,}匹配至少7个非数字

var str = 'google8';

alert(pattern.test(str));

/*使用锚元字符匹配*/

var pattern = /^google$/; 　　　　 //^从开头匹配，$从结尾开始匹配，开头结尾必须都是google

var str = 'google';

alert(pattern.test(str));

var pattern = /goo\sgle/; //\s可以匹配到空格

var str = 'goo gle';

alert(pattern.test(str)); //true

var pattern = /google\b/; //\b可以匹配是否到了边界

var str = 'google';

alert(pattern.test(str));

/*使用或模式匹配*/

var pattern = /google|baidu|bing/; //匹配三种其中一种字符串

var str = 'google';

alert(pattern.test(str)); 　　　　//true

/*使用分组模式匹配*/

var pattern = /(google){4,8}/; 　　　//匹配分组里的字符串4-8次（分组相当于一个字符）

var str = 'googlegoogle';

alert(pattern.test(str)); 　　　　　　　　 //false

var pattern = /8(.*)8/; 　　　　　　//获取8..8之间的任意字符

var str = 'This is 8google8';

str.match(pattern);

alert(RegExp.$1); 　　　　　　　　　　　　 //得到第一个分组里的字符串内容（前提是运行一下），这儿是：google

var pattern = /8(.*)8/;

var str = 'This is 8google8';

var result = str.replace(pattern,'$1'); //得到替换的字符串输出

document.write(result);

var pattern = /(.*)\s(.*)/;

var str = 'google baidu';

var result = str.replace(pattern, '$2 $1'); //将两个分组的值替换输出

document.write(result); 　　　　//baidu google

贪婪问题：

贪婪	惰性
+	+?
?	??
*	*?
{n}	{n}?
{n,}	{n,}?
{n,m}	{n,m}?

/*关于贪婪和惰性*/

var pattern = /[a-z]+?/; 　　　　　　　　　　　　　　　　　　　　 //?号关闭了贪婪匹配，只替换了第一个，否则用贪婪下面的都会变为xxx。。。。。

var str = 'abcdefjhijklmnopqrstuvwxyz';

var result = str.replace(pattern, 'xxx');

alert(result);

//禁止了贪婪，开启的全局（下面三段代码好好理解！）

var pattern = /8(.*)8/; 　　 //使用了贪婪

var str = '8google8 8google8 8google8'; 　　　　　　　　　　　　 //匹配到了google8 8google8 8google

document.write(str.replace(pattern, '$1'));　　　　//结果：google8 8google8 8google

var pattern = /8(.*?)8/g; 　　　　　　　　//使用了惰性，开启全局

var str = '8google8 8google8 8google8';

document.write(str.replace(pattern, '$1'));

//这次结果正确了

//google

var pattern = /8([^8]*)8/g; 　　　　　　　　　　　　//另一种禁止贪婪（屏蔽掉8）

var str = 'This is 8google8, That is 8google8, There is 8google8';

var result = str.replace(pattern,'$1');

document.write(result);

/*使用exec返回数组*/

var pattern = /^[a-z]+\s[0-9]{4}$/i;

var str = 'google 2012';

alert(pattern.exec(str)); 　　　　　　　　　　　　　//返回整个字符串

var pattern = /^[a-z]+/i; 　　　　　　　　　　　　//只匹配字母

var str = 'google 2012';

alert(pattern.exec(str)); 　　　　　　　　　　　　 //返回google

var pattern = /^([a-z]+)\s([0-9]{4})$/; 　　　　　　　　　　　　　 //使用了分组

var str = 'google 2012';

var a = pattern.exec(str);

//alert(a.length);　　　　　　　　　　 //3

//alert(a[0]); //a[0]，返回匹配到的整个字符串google 2012

//alert(a[1]); //a[1]，返回匹配到的第一个分组的字符串google

//alert(a[2]); //a[2]，返回匹配到的第二个分组的字符串2012

var pattern = /(\d+)([a-z])/; //这个叫做捕获性分组，所有的分组都捕获返回

var str = '123abc';

var a = pattern.exec(str);

//a[0]返回123a

//a[1]返回123

//a[2]返回a

var pattern = /(\d+)(?:[a-z])/; //非捕获性分组，只要在不需要捕获返回的分组加上?:

var str = '123abc';

alert(pattern.exec(str));

/*使用分组嵌套*/

var pattern = /(a?(b?(c?)))/; //嵌套分组，从外往内获取

var str = 'abc';

alert(pattern.exec(str));

//第一步：a[0]，整个匹配到的字符串abc

//第二步：a[1]，匹配第一个分组(a?(b?(c?))), abc

//第三步：a[2]，匹配第二个分组(b?(c?)， bc

//第三步：a[3]，匹配第三个分组(c?)， c

/*使用前瞻捕获*/

var pattern = /(goo(?=gle))/; //goo后面必须跟着gle才能捕获goo

var str = 'google';

alert(pattern.exec(str)); 　　　　　 //注意这儿返回的是goo

/*使用特殊字符匹配*/

var pattern = /\.\[\/b\]/; //特殊字符，用\符号转义即可

var str = '.[/b]';

alert(pattern.test(str));

/*使用换行模式*/

var pattern = /^\d+/mg; //启用了换行模式

var str = '1.baidu\n2.google\n3.bing';

var result = str.replace(pattern, '#');

alert(result);

For my lover, CC !

Thank you, Mr Lee !

posted @ 2014-09-07 09:31 努力就有机会阅读(923) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

努力就有机会

正则表达式（下）

公告