正则表达式匹配
步骤:
1、用 import re 导入正则表达式模块;
2、用 re.compile() 函数创建一个 Regex 对象(记得使用原始字符串);
3、向 Regex 对象的 search()方法传入想查找的字符串。它返回一个 Match 对象;
4、调用 Match 对象的 group() 方法,返回实际匹配文本的字符串。
正则表达式符号:
- ?匹配零次或一次前面的分组
- *匹配零次或多次前面的分组
- +匹配一次货多次前面的分组
- {n}匹配n 次前面的分组
- {n,}匹配n 次或更多前面的分组
- {,m}匹配零次到m 次前面的分组
- {n,m}匹配至少n 次、至多m 次前面的分组
- {n,m}?或 *? 或 +? 对前面的分组进行非贪心匹配
- ^spam 意味着字符串必须以 spam 开始
- spam$ 意味着字符串必须以 spam 结束
- .匹配所有字符,换行符除外
- \d、\w 和\s 分别匹配数字、单词和空格
- \D、\W 和\S 分别匹配除数字、单词和空格外的所有字符
- [abc]匹配方括号内的任意字符(诸如 a、b 或 c)
- [^abc]匹配不在方括号内的任意字符