JavaScript正则表达式基础知识汇总
一、创建正则对象:
1、构造函数RegExp创建正则对象
1 var pattern = new RegExp('s$'); //pattern匹配以s结尾的字符串
2、使用正则直接量
1 var pattern = /s$/; //建议这样写
二、正则表达式字符
1、反斜线\ 在正则表达式中表示转义序列
特殊符号:
^ $ . * + ? = ! : | \ / ( ) [ ] { }
如果想要在正则表达式中匹配它们,应该在他们前面加上反斜线,如:
var pattern = /\$/; //pattern匹配$符号
2、直接量字符
字符 匹配
\o NUL字符(\u0000)
\t 制表符(\u0009)
\n 换行符(\u000A)
\v 垂直制表符(\u000B)
\f 换页符
\r 回车符
\xnn 由十六进制数nn指定的拉丁字符,例如:\x0A等价于\n
\uxxxx 由十六进制数xxxx指定的Unicode字符,例如:\u0009等价于\t
\cX 控制字符^X。例如:\cJ等价于换行符\n
3、字符类
字符 匹配 [...] 方括号内的任意字符 [^...] 非方括号内的任意字符 [0-9] 0-9之间的数字 [a-z] 小写的拉丁字母 [A-Z] 大写的拉丁字母 [0-9a-zA-Z] 数字和大小写拉丁字母
下面也属于字符类:
. 除换行符和其他Unicode行终止符之外的任意字符 \s 任意Unicode空白符 \S 任意非Unicode空白符 \d 任意ASCII码数字,等同于[0-9] \D 任意非ASCII码数字的字符,等同于[^0-9] \w 任意ASCII码单词字符,等同于[a-zA-Z0-9_] \W 任意非ASCII数字,等同于[^a-zA-Z0-9_] [\b] 在字符类中表示退格直接量
4、重复字符类
贪婪的重复字符
字符 匹配 {n,m} 前一项至少n次,但不能超过m次 {n,} 前一项至少n次 {n} 前一项恰好n次 ? 前一项0次或1次,等价于{0,1} + 前一项至少一次,等价于{1,} * 前一项0次或多次,等价于{0,}
非贪婪的重复匹配只需在贪婪的重复字符后面加上一个?(问号),且问号后没有其他表达式字符,否则非贪婪匹配忽略。例:
1 var str = 'aaaaaa', 2 str2 = 'aaaaaabc', 3 pattern = /a+/, 4 pattern2, 5 pattern3; 6 7 pattern.exec(str); //全部匹配 8 9 pattern2 = /a+?/; 10 pattern2.exec(str); //只匹配了变量str中的第一个a 11 12 pattern3 = /a+?bc/; 13 pattern3.exec(str2); //全部匹配,匹配结果为aaaaaabc
5、选择,分组,引用
字符 含义 | 表示或,用于分隔选择 () 子表达式(子模式),可以引用子模式匹配结果 (?:) 子表达式(子模式),可以引用子模式匹配结果,但是子模式匹配结果不出现在正则匹配结果集中 \n(n为数字) 引用对应的子模式匹配结果
例:
1 var pattern = /Java(?:Script)?(&VB\1)?/g, 2 str = 'JavaScript&VBScript'; 3 4 pattern.exec(str); //全部匹配,\1表示Script字符串 5 pattern.lastIndex = 0; //当正则对象拥有全局g标识时,如果同一个正则对象进行第二次匹配时,须将它的lastIndex重置为 0 6 pattern.exec(str); //第二次全部匹配
下面情况可能存在不能实现的期望:
var pattern = /(Java(?:Script))?&?(VB\2)?/, //或者写成pattern = /Java(?:Script)|(VB\1)?/; str = 'VBScript'; pattern.exec(str); //不能匹配VBScript,\2表示为空,结果匹配VB子串 var str2 = 'JavaScript&VBScript'; pattern.exec(str2); //这样可以全部匹配 //此例说明应该注意自己引用的子模式是否为空
6、位置字符
字符 匹配 ^ 字符串的开头 $ 字符串的结尾 \b 位于\w(单词字符)与\W(非单词字符)的边界或位于一个ASCII单词字符与一个字符串的开头和结尾之间的边界 \B 非词语之间的位置 (?=p) 正前向声明,要求接下来的字符与模式p匹配,但是不包括匹配中的那些字符 (?!p) 反前向声明,要求接下来的字符不与模式p匹配
例:
1 var url = 'vip.etao.com/youhui.htm?drawCredits', 2 pattern = /\byouhui\b/, 3 pattern2 = /^vip\.etao\.com\/.+drawcredits$/i; 4 pattern.exec(url); //匹配youhui子串 5 pattern2.exec(url); //全部匹配url变量值
三、正则对象标志,属性,及方法
1、标志
标志 含义
g 全局匹配
i 不区分大小写
m 多行匹配
2、方法
exec 接受一个字符串参数,返回由完全匹配和子表达式匹配结果组成的数组
test 接受一个字符串参数,返回boolean值
compile 编译正则表达式
3、属性
source 正则表达式的文本
global 是否拥有全局搜索标志g
ignoreCase 是否拥有标志i
multiline 是否拥有标志m
lastIndex 搜索匹配的开始位置(可读写)
数字正则:-?(\d+|\d+\.\d+|\.\d+)([eE][-+]?\d+)?