1.在python中使用正则表达式,需要引入re模块
2.元字符
. ^ $ * + ? { } [ ] | ( ) \
^:控制开头,当在[]中搭配时,表示非
$:控制结尾
*:匹配零到多个,默认为贪婪匹配,若要实现非贪婪模式,相应的字符后面要加上?
\:反斜杠后边跟元字符取出特殊功能,反斜杠后边跟普通字符实现特殊功能
引用序号对应的子组所匹配的字符串
re.search(r"(alex)(eric)com\2","alexericcomeric")
\d:[0-9]
\D:[^0-9]
\s:匹配任何空白字符[\t\n\r\f\v]
\S:匹配任何非空白字符
\w:匹配任何字母数字[a-zA-Z0-9]
\b:匹配一个单词边界
3.findall()
找到所有匹配的子串,并返回
re.findall('lvjy','hello,lvjy')
4.search():查找到一个匹配的字符则返回
5.match():从第一个字符开始匹配到则返回