正则表达式
1、什么叫正则表达式:正则表达式,又称规则表达式,英文名为Regular Expression,在代码中常简写为regex、regexp或RE,是计算机科学的一个概念。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。正则表达式是对字符串和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式,模式描述在搜索文本时要匹配的一个或多个字符串。
2、正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。
. :用于匹配除换行符之外的所有字符。
\s:用于匹配单个空格符,包括tab键和换行、制表符、换页符等。与 [ \f\n\r\t\v] 等效。;
\S:匹配任何非空白字符。与 [^ \f\n\r\t\v] 等效。
\d:用于匹配从0到9的数字;
\w:用于匹配字母、数字或下划线字符;
\W:用于匹配所有与\w不匹配的字符;
等等
4、java.util.regex 包主要包括以下三个类:
- Pattern 类:pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。
- Matcher 类:Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。