正则表达式
正则表达式:
就是匹配字符串内容的一种规则。
官方定义:正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符以及这些特定字符的组合,组成的一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
在线测试工具: http://tool.chinaz.com/regex/
字符组:[字符组]
在同一个位置可能出现的各种字符组成了一个字符组,在正则表达式中用[]表示。
字符分为很多类,比如数字、字母、标点等等
字符:
量词:
几个常用的非贪婪匹配Pattern:
*?重复任意次,但尽可能少重复
+?重复一次或者更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}?重复n到m次,但尽可能少重复
{n,}?重复n次以上,但尽可能少重复
.*?的用法:
. 是除换行符之外的任意字符
* 是取0至无限长度
?是非贪婪模式
合在一起就是:取尽量少的任意字符,一般用在:
.*?x 就是取前面任意长度的字符,直到一个x出现。