第十章 正则表达式
2013-08-06 21:56 xchit 阅读(348) 评论(0) 收藏 举报一、什么是正则表达式
正则表达式(regular expression)是一个描述字符模式的对象。ECMAScript的RegExp类表示正则表达式,而String和RegExp都定义的使用正则表达式进行强大的模式匹配和文本检索与替换的函数。
正则表示式主要是用来验证客户端输入的数据。用户填写完表单点击按钮之后,表单会发送到服务器,在服务器通常会用PHP,ASP.NET,JAVA等服务器脚本对其进行进一步处理。因为客服端验证,可以节约大量服务器的系统资源,并且提供更好的用户体验。
二、创建正则表达式
创建正则表达式和创建字符串类似,创建正则表示是提供两种方式,一种采用new运算符,另外一种采用字面量方式。
1.两种创建方式
var regex=new RegExp('regex'); //第一个参数字符串
var regex=new RegExp('regex','ig'); //第二参数可选模式修饰符
参 数 | 含 义 |
i | 忽略大小写 |
g | 全局匹配 |
m | 多行匹配 |
var regex=/regex/; //两个反斜杠是正则表达式的字面量表示法
var regex=/regex/ig; //第二反斜杠后面加上模式修饰符
2.测试正则表达式
RegExp对象包含两个方法:test()和exec(),功能基本相似,用于测试字符串匹配。test()方法在字符串中查找是否存在指定的正则表达式并返回布尔值,如果存在则返回true,反之false。exec()方法用于在字符串中查找自定正则表达式,如果exec()方法执行成功,则返回包含该查找字符串的相关信息数组。如果执行失败,则返回null。
方法 | 功能 |
test | 在字符串中测试模式匹配,返回true和false |
exec | 在字符串中执行匹配搜索,返回结果数组 |
/*使用new运算符的test方法示例*/
var pattern=new RegExp("book","i"); //创建正则模式,不区分大小写
var str="this is book!"; //创建要对比的字符串
alert(pattern.test(str);) //true 通过test方法验证是否匹配
/*使用字面量方式的test方法示例*/
var pattern=/book/i; //创建正则模式,不区分大小写
var str="this is book!";
alert(pattern.test(str);) //true
还可以这样写:alert(/book/i.test('this is book!')); //true,一句话匹配
/*使用exec返回匹配数组*/
var pattern=/book/i;
var str="this is book!";
alert(pattern.exec(str));//book
3.使用字符串的正则表达式方式
除了test()和exec()方法,String对象也提供了4个使用正则表达式的方法。
方 法 | 含 义 |
match(pattern) | 返回pattern中的字符串或null |
replace(pattern,replacement) | 返回replacement替换pattern |
search(pattern) | 返回字符串中pattern开始位置 |
split(pattern) | 返回字符串按指定pattern拆分的数组 |
/*使用match方法获取匹配数组*/
var pattern=/book/ig; //不区分大小写,全局搜索
var str="this is book!,that is a book too!";
alert(str.match(pattern)); //匹配到两个book,book
/*使用search方法查找匹配数据*/
var pattern=/book/ig;
var str="this is book!,that is a book too!";
alert(str.search(pattern)); //8 返回查找的位置
/*使用replace替换匹配到的数据*/
var pattern=/book/ig;
var str="this is book!,that is a book too!";
alert(str.replace(pattern,'apple')); //将book替换成apple
/*使用split拆分字符串数据*/
var pattern=/book/ig;
var str="this is book!,that is a book too!";
alert(str.split(pattern)); //将book拆分成数据
属 性 | 短 名 | 含 义 |
input | $_ | 当前被匹配的字符串 |
lastMatch | $& | 最后一个匹配的字符串 |
lastParen | $+ | 最后一对圆括号内的匹配字符串 |
leftContext | $` | 最后一次匹配前的字符串 |
multiline | $* | 用于指定是否所有的表达式都用于多行的布尔值 |
rightContext | $' | 在上一次匹配之后的字符串 |
三、获取控制
正则表达式元字符是包含特殊含义的字符。它们有一些特殊的功能,可以控制匹配模式的方式。反斜杠后的元字符将失去其特殊含义。
元字符/元符号 | 匹配情况 |
. | 匹配除换行符外任意字符 |
[a-z0-9] | 匹配括号中的字符集中的任何字符 |
[^a-z0-9] | 匹配任意不在括号中的字符集中的字符 |
\d | 匹配数字 |
\D | 匹配非数字,同[^0-9]相同 |
\w | 匹配字母和数字还有下划线_ |
\W | 匹配非字符和数字还有下划线_ |
\0 | 匹配null字符 |
\b | 匹配空格字符 |
\f | 匹配进纸字符 |
\n | 匹配换行符 |
\r | 匹配回车字符 |
\t | 匹配制表符 |
\s | 匹配空白字符、空格、制表符和换行符 |
\S | 匹配非空白字符 |
^ | 行首匹配 |
$ | 行尾匹配 |
\A | 只有匹配字符串开始处 |
\b | 匹配单词边界,词在[]内无效 |
\B | 匹配非单词边界 |
\G | 匹配当前搜索的开始位置 |
\Z | 匹配字符串结束或行尾 |
\z | 只匹配字符串结束处 |
x? | 匹配0个或1个x |
x* | 匹配0个或任意多个x |
x+ | 匹配至少一个x |
(xyz)+ | 匹配至少一个(xyz) |
x{m,n} | 匹配最少m个,最多n个x |
this|where|logo | 匹配this或where或logo中任意一个 |
(string) | 用于反向引用分组 |
\1或$1 | 匹配第一个分组中的内容 |
\2或$2 | 匹配第二个分组中的内容 |
\3或$3 | 匹配第三个分组中的内容 |
/*使用点元字符*/
var pattern=/g..gle/; //.匹配一个任意字符
var str='google';
alert(pattern.test(str)); //true
/*重复匹配*/
var pattern=/g.*gle/; //.匹配0个一个或多个
varstr='google'; //*,?,+,{n,m}
alert(pattern.test(str)); //true
/*使用字符类匹配*/
var pattern=/g[a-zA-Z_]*gle/; //[a-z]*表示任意个a-z中的字符
var str='google';
alert(pattern.test(str)); //true
/*使用元符号匹配*/
var pattern=/g\w*gle/; //\w*匹配任意多个所有字母数字_
var str='google';
alert(pattern.test(str)); //true
/*使用锚元字符匹配*/
var pattern=/^google$/; //^从开头匹配,$从结尾开始匹配
var str='google';
alert(pattern.test(str));
/*使用或模式匹配*/
var pattern=/google|baidu|bing/; //匹配三种其中一种字符串
var str='google';
alert(pattern.test(str));
/*使用分组模式匹配*/
var pattern=/(google){4,8}/; //匹配分组里的字符串4-8次
var str='googlegoogle';
alert(pattern.test(str));
贪 婪 | 惰 性 |
+ | +? |
? | ?? |
* | *? |
{n} | {n}? |
{n,} | {n,}? |
{n,m} | {n,m}? |
/*关于贪婪和惰性*/
var pattern=/[a-z]+?/; //?号关闭了贪婪匹配,只替换了第一个
var str='abcdefjhijklmnopqrstuvwxyz';
var result=str.replace(pattern,'xxx');
alert(result); //xxxbcdefjhijklmnopqrstuvwxyz
/*使用exec返回数组*/
var pattern=/^[a-z]+\s[0-9]{4}$/i;
var str='google2012';
alert(pattern.exec(str)); //返回整个字符串
/*捕获性分组和非捕获性分组*/
varpattern=/(\d+)([a-z])/; //捕获性分组
var str='123abc';
alert(pattern.exec(str));
/*使用分组嵌套*/
var pattern=/(A?(B?(C?)))/; //从外往内获取
var str='ABC';
alert(pattern.exec(str));
/*使用前瞻捕获*/
var pattern=/(goo(?=gle))/; //goo后面必须跟着gle才能捕获
var str='google';
alert(pattern.exec(str));
/*使用特殊字符匹配*/
var pattern=/\.\[\/b\]/; //特殊字符,用\符号转义即可
var str='.[/b]';
alert(pattern.test(str));
/*使用换行模式*/
var pattern=/^\d+/mg; //启用了换行模式
var str='1.baidu\n2.google\n3.bing';
var result=str.replace(pattern,'#');
alert(result);
四、常用的正则
1.检查邮政编码
var pattern=/[1-9][0-9]{5}/; //共6位数字,第一位不能为0
var str='224000';
alert(pattern.test(str));
2.检查文件压缩包
var pattern=/[\w]+\.zip|rar|gz/; //\d\w_表示所有数字和字母加下划线
var str='123.zip'; //\.表示匹配.,后面是一个选择
alert(pattern.test(str));
3.删除多余空格
var pattern=/\s/g; //g必须全局,才能全部匹配
var str='111 22 2 33 3';
var result=str.replace(pattern,''); //把空格匹配成无空格
alert(result);
4.删除首尾空格
var pattern=/^\s+/; //强制首
var str=' goo gle ';
var result=str.replace(pattern,'');
pattern=/\s+$/; //强制尾
result=result.replace(pattern,'');
alert('|'+result+'|');
var pattern=/^\s*(.+?)\s*$/; //使用了非贪婪捕获
var str=' google ';
alert('|'+pattern.exec(str)[1]+'|');
var pattern=/^\s*(.+?)\s*$/;
var str=' google ';
alert('|'+str.replace(pattern,'$1')+'|'); //使用了分组获取
5.简单的电子邮件验证
var pattern=/^([a-zA-Z0-9_\.\-]+)@([a-zA-Z0-9_\.\-]+)\.([a-zA-Z]{2,4})$/;
var str='xxxxx@gmail.com';
alert(pattern.test(str));
var pattern=/^([\w\.\-]+)@([\w\.\-]+)\.([\w]{2,4})$/;
var str='xxxx.com@gmail.com';
alert(pattern.test(str));