python 包之 re 正则匹配教程
一、开头匹配
-
从字符串开头开始匹配
-
返回匹配对象;如果找不到匹配,则为None
import re
print(re.match('飞兔小哥', '飞兔小哥教你零基础学编程'))
print(re.match('学编程', '飞兔小哥教你零基础学编程'))
二、全匹配
-
匹配字符串是否和给定的字符一模一样
-
如果一模一样才返回匹配对象,如果找不到匹配,则为None
import re
print(re.fullmatch('飞兔小哥教你零基础学编程', '飞兔小哥教你零基础学编程'))
print(re.fullmatch('飞兔小哥', '飞兔小哥教你零基础学编程'))
三、部分匹配
-
只要在字符串中找到字符存在即可
-
找到返回匹配对象,如果找不到匹配,则为None
import re
print(re.search('autofelix', '飞兔小哥教你零基础学编程'))
print(re.search('飞兔小哥', '飞兔小哥教你零基础学编程'))
四、匹配替换
-
用正则表达式去匹配原始字符串,并把匹配到的内容替换
import re
# 去掉电话号码中的-
num = re.sub(r'\D', '', '188-1926-8053')
print(num)
# 18819268053
五、匹配替换返回数量
-
用正则表达式去匹配原始字符串,并把匹配到的内容替换
-
并且返回被替换掉的数量
import re
# 去掉电话号码中的-
num = re.subn(r'\D', '', '188-1926-8053')
print(num)
# (18819268053, 2)
六、分割字符串
-
按照正则表达式的规则来分割字符串,并返回列表
-
可以规定分割的次数
import re
print(re.split('a*', 'hello world'))
# ['', 'h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd', '']
print(re.split('a*', 'hello world', 1))
# ['', 'hello world']
七、匹配所有
-
在字符串中匹配所有符合正则表达式的对象
-
并把这些对象通过列表list的形式返回
import re
pattern = re.compile(r'\W+')
result1 = pattern.findall('hello world!')
result2 = pattern.findall('hello world!', 0, 7)
print(result1)
# [' ', '!']
print(result2)
# [' ']
八、迭代器匹配
-
在字符串中匹配所有符合正则表达式的对象
-
并把这些对象通过迭代器的形式返回
import re
pattern = re.compile(r'\W+')
result = pattern.finditer('hello world!')
for r in result:
print(r)
九、编译对象
-
把正则表达式编译成Pattern对象
import re
pattern = re.compile(r'\W+')
十、修饰符
-
re.I:忽略大小写
-
re.L:本地化识别匹配
-
re.M:多行匹配
-
re.S:使.匹配包括换行在内的所有字符
-
re.U:根据unicode字符解析字符
-
re.X:给予灵活的格式以便理解
import re
content = "Cats are smarter than dogs"
print(re.search(r'DOGS', content, re.M | re.I))