正则表达式

• 普通字符
  • – 字母、数字、汉字、下划线、以及后边章节中没有特殊定义的标点符号,都是 "普通字符"。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同 的一个字符。
  • – 举例1:表达式 "c",在匹配字符串 "abcde" 时,匹配结果是:成功;匹配到 的内容是:"c";匹配到的位置是:开始于2,结束于3。(注:下标从0开始还 是从1开始,因当前编程语言的不同而可能不同)
  • – 举例2:表达式 "bcd",在匹配字符串 "abcde" 时,匹配结果是:成功;匹配 到的内容是:"bcd";匹配到的位置是:开始于1,结束于4。
• 简单的转义字符
– 一些不便书写的字符,采用在前面加 "\" 的方法。
\n
代表换行符
\t
制表符
\\
代表\本身
\^ ,\$ , \. ,\( , \) , \{ , \} , \? , \+ , \* , \| ,\[, \]
匹配这些字符本
 
标准字符集合:能够与“多种字符”匹配的表达式 –
(注意区分大小写,大写是相反的意思)
\d
任意一个数字,0~9 中的任意一个
\w
任意一个字母或数字或下划线,也就是 A~Z,a~z,0~9,_ 中任意一个
\s
包括空格、制表符、换行符等空白字符的其中任意一个
.
小数点可以匹配除了换行符(\n)以外 的任意一个字符 :在单行模式下面 可以匹配包含换行符在内的任意字符。
• 自定义字符集合:[ ]方括号匹配方式,匹配方括号中任意一个字符
[ab5@]
匹配 "a" 或 "b" 或 "5" 或 "@"
[^abc]
匹配 “a”,“b”,“c” 之外的任意一个字符 ^放到方括号内表示取 反的含义
[f-k]
匹配 "f"~"k" 之间的任意一个字母
[^A-F0-3]
匹配 "A"~"F","0"~"3" 之外的任意一个字符
 

 
匹配模式
• IGNORECASE 忽略大小写模式
– 匹配时忽略大小写。
– 默认情况下,正则表达式是要区分大小写的。
 
• SINGLELINE 单行模式
– 整个文本看作一个字符串,只有一个开头,一个结尾。
– 使小数点 "." 可以匹配包含换行符(\n)在内的任意字符。
 
• MULTILINE 多行模式
– 每行都是一个字符串,都有开头和结尾。
– 在指定了 MULTILINE 之后,如果需要仅匹配字符串开始和结束位置, 可以使用 \A 和 \Z
 
 
Java使用正则表达式
• 类 Pattern:
– 正则表达式的编译表示形式。
– Pattern p = Pattern. compile(r,int) ; //建立正则表达式,并启用相应 模式
• 类 Matcher:
– 通过解释 Pattern 对字符串执行匹配操作的引擎
– Matcher m = p.matcher(str); //匹配str字符串
– matches() find() reset() group()
• 编程中使用正则表达式常见情况:
– 验证表达式是否匹配整个字符串
– 验证表达式是否可以匹配字符串的子字符串
– 返回给定字符串中匹配给定正则表达式所有子字符串
– 替换给定字符串中匹配正则表达式的子字符串
– 根据正则表达式定义规则截取字符串
 
JavaScript使用正则表达式
 
 
 
 
posted @ 2019-05-20 19:08  ___mouM  阅读(212)  评论(0编辑  收藏  举报