正则表达式

正则表达式\((regular\ expression)\)

正则表达式是一个字符串,用来描述匹配一个字符串集合的模式,可以使用正则表达式来匹配、替换和拆分字符串

匹配字符串

我们先来看一下\(String\)类中的\(matches\)方法,它可以判断字符串\(s\)和字符串\(t\)是否匹配下面两个语句的结果都为\(true\)

"java".matches("java"); // true
"java".equals("java"); // true

在上面的样例中,\(matches\)方法匹配了一个固定的字符串,但是实际上\(matches\)方法还可以匹配符合一个模式的字符串集,例如:

"java is good".matches("java.*"); // true
"java are you".matches("java.*"); // true
"javacanyou".matches("java.*"); // true

样例中的“java.*”是一个正则表达式,他描述了一个字符串模式:以java为前缀,后面跟着若干个字符串(可能是0个),“.*”代表匹配0或任意多个字符

正则表达式语法

正则表达式由字面值字符和特殊字符组成


注意事项:

  1. 单词字符可以是任何字母、数字或者下划线字符,即\w 等价于 \([a-z[A-Z][0-9]\_]\)
  2. 量词符:* + ? {n} {n,} {n,m},用于确定量词符前面的模式串会重复多少次
  3. *:代表前面的模式串出现任意次(包括0)
  4. +:代表前面的模式串至少出现1次
  5. ?:代表前面的模式串只能出现0次或1次
  6. {n}:代表前面的模式串只能出现n次
  7. {n,}:代表前面的模式串至少出现n次
  8. {n,m}:代表前面的模式串只能出现n次到m次之间
  9. 不要在重复量词符中使用空白
  10. 可以利用括号将模式串进行分组
  11. .*:代表任意字符串

替换和拆分字符串

除了\(matches\)方法,\(String\)类也包含\(replaceAll,replaceFirst,split\)方法,用于替换和拆分字符串

str.replaceAll(regex,String s); // 替换str中所有的能够匹配模式串的子串为字符串s
str.replaceFirst(regex,String s); // 替换str中第一个能够匹配模式串的子串为字符串s
String tokens = str.spict(regex,limit); //代表将字符串str以模式串为分隔符进行分割,limit确定匹配分割符的次数(分割的次数),默认贪心匹配,匹配尽量多的分隔符,如果limit>1,代表最多匹配limit-1次

注意:

  • 所有的量词符匹配时都是贪心的,他们会尽可能多匹配,但是我们可以在其后面添加问号来使得量词符变得懒惰,也就意味着只要第一次匹配成功就退出匹配
posted @ 2023-03-23 16:36  Zeoy_kkk  阅读(23)  评论(0编辑  收藏  举报