好好学一遍JavaScript 笔记(七)——RegExp对象与常用正则
欢迎技术交流。 QQ:138986722
javaScript RegExp对象:
global——Boolean值、表示g(全局选项)是否已设置
ignoreCase——Boolean值、表示i(忽略大小写选项)是否已设置
lastIndex——整数、代表下次匹配将会从哪个字符位置开始(只有当使用exec()或test()函数才会填入、否则为0)
multiline——Boolean值、表示m(多行模式选项)是否已设置
source——正则表达式的源字符串形式。例如、表达式/[ba]*/的source将返回"[ba]*"。
一般不会使用global、ignoreCase、multiline和source属性、因为一般之前就已知道了这些数据。
真正有用的属性是lastIndex、它可以告诉你正则表达式在某个字符串中停止之前、查找了多远。
var sToMatch = "bbq is short for barbecue"; var reB = /b/g; reB.exec(sToMatch); alert(reB.lastIndex); //out: 1 reB.exec(sToMatch); alert(reB.lastIndex); //out: 2 reB.exec(sToMatch); alert(reB.lastIndex); //out: 18 reB.exec(sToMatch); alert(reB.lastIndex); //out: 21正则表达式reB查找的是b。当它首次检测sToMatch时、
它发现在第一个位置——也就是位置0——是b;
因此、lastIndex属性就被设置成1、
而再次调用exec()时就从这个地方开始执行。
再次调用exec()、表达式在位置1又发现了b、
于是将lastIndex设值为2.第三次调用时、发现b在位置17、
于是又将lastIndex设值为18、如此继续。
如果想从头开始匹配、则可以将lastIndex设为0。
静态属性:
/** * 它们都有两个名字:一个复杂名字和一个以美元符号开头的简短名字。 * 长名 短名 描述 * input $_ 最后用于匹配的字符串(传递给exec()或test()的字符串) * lastMatch $& 最后匹配的字符 * lastParen $+ 最后匹配的分组 * leftContext $` 在上次匹配的前面的子串 * multiline $* 用于指定是否所有表达式都使用多行模式的布尔值 * rightContext $' 在上次匹配之后的子串 */ var sToMatch = "古道西风瘦马、夕阳西下、断肠人在天涯!"; var reB = /(西)风/g; reB.test(sToMatch); alert(RegExp.$_); //out:古道西风瘦马、夕阳西下、断肠人在天涯! alert(RegExp.leftContext); //out:古道 /* * 使用短名时有些字符是不合法的需要使用[] * ["$'"] * ["$+"] * ["$&"] * ["$`"] */ alert(RegExp["$'"]); //out:瘦马、夕阳西下、断肠人在天涯!常用正则验证——原链接:http://topic.csdn.net/u/20080820/14/dadb903c-8724-422e-a3bd-f2f1c4e812c6.html
^\d+$ //匹配非负整数(正整数 + 0) ^[0-9]*[1-9][0-9]*$ //匹配正整数 ^((-\d+)|(0+))$ //匹配非正整数(负整数 + 0) ^-[0-9]*[1-9][0-9]*$ //匹配负整数 ^-?\d+$ //匹配整数 ^\d+(\.\d+)?$ //匹配非负浮点数(正浮点数 + 0) ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$ //匹配正浮点数 ^((-\d+(\.\d+)?)|(0+(\.0+)?))$ //匹配非正浮点数(负浮点数 + 0) ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$ //匹配负浮点数 ^(-?\d+)(\.\d+)?$ //匹配浮点数 ^[A-Za-z]+$ //匹配由26个英文字母组成的字符串 ^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串 ^[a-z]+$ //匹配由26个英文字母的小写组成的字符串 ^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串 ^\w+$ //匹配由数字、26个英文字母或者下划线组成的字符串 ^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$ //匹配email地址 ^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$ //匹配url 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内):[^\x00-\xff] 应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;} 匹配空行的正则表达式:\n[\s| ]*\r 匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/ 匹配首尾空格的正则表达式:(^\s*)|(\s*$)
/* 正则表达式用例 * 1、^\S+[a-z A-Z]$ 不能为空 不能有空格 只能是英文字母 * 2、\S{6,} 不能为空 六位以上 * 3、^\d+$ 不能有空格 不能非数字 * 4、(.*)(\.jpg|\.bmp)$ 只能是jpg和bmp格式 * 5、^\d{4}\-\d{1,2}-\d{1,2}$ 只能是2004-10-22格式 * 6、^0$ 至少选一项 * 7、^0{2,}$ 至少选两项 * 8、^[\s|\S]{20,}$ 不能为空 二十字以上 * 9、^\+?[a-z0-9](([-+.]|[_]+)?[a-z0-9]+)*@([a-z0-9]+(\.|\-))+[a-z]{2,6}$邮件 * 10、\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*([,;]\s*\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*)* 输入多个地址用逗号或空格分隔邮件 * 11、^(\([0-9]+\))?[0-9]{7,8}$电话号码7位或8位或前面有区号例如(022)87341628 * 12、^[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+(\,[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+)*$ * 只能是字母、数字、下划线;必须有@和.同时格式要规范 邮件 * 13 ^\w+@\w+(\.\w+)+(\,\w+@\w+(\.\w+)+)*$上面表达式也可以写成这样子,更精练。 14 ^\w+((-\w+)|(\.\w+))*\@\w+((\.|-)\w+)*\.\w+$补充:
21。匹配空行的正则表达式:\n[\s| ]*\r 21。匹配空行的正则表达式:/^\s*$/m 22。匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*)\/>/ 22。匹配HTML标记的正则表达式:/<([^>]+)>[^<>]*<\/\1>|<([^>]+)\/>/ 这个实际上作用不大,因为正则表达式不能支持嵌套匹配,仅 .NET 的表达式引擎有这个功能。 23。匹配首尾空格的正则表达式:(^\s*)|(\s*$) 23。匹配首尾空格的正则表达式:^\s+|\s+$ 为 JavaScript 的 String 增加 trim() 函数: String.prototype.trim = function() { return this.replace(/^\s+/, '').replace(/\s+$/, ''); } * 4、(.*)(\.jpg|\.bmp)$ 只能是jpg和bmp格式 * 4、([^.]+)\.(jpg|bmp) 只能是jpg和bmp格式 * 8、^[\s|\S]{20,}$ 不能为空 二十字以上 * 8、^\S{20,}$ 不能为空 二十字以上
常用正则链接:
http://www.aslibra.com/doc/regex.htm
http://www.jb51.net/article/21484.htm
http://www.blueidea.com/tech/program/2004/2273.asp
http://www.douban.com/group/topic/3402632/
http://www.blogjava.net/Vikings/archive/2006/01/06/26893.html