python中使用正则表达式
1. re模块的介绍
在Python中需要通过正则表达式对字符串进行匹配的时候,可以使用一个 re 模块
# 导入re模块 import re # 使用match方法进行匹配操作 result = re.match(正则表达式,要匹配的字符串) # 如果上一步匹配到数据的话,可以使用group方法来提取数据 result.group()
2. re模块的使用
import re # 使用match方法进行匹配操作 result = re.match("ab.c", "abdcn") # 获取匹配结果 if result: info = result.group() print(info) else: print("没匹配上")
说明:
- re.match()方法如果匹配到字符串,返回得时一个<re.Match object; span=(0, 3), match='tow'>, 没有匹配到则为None, 因此可用if判断释放匹配到
运行结果:
itcast
3. 解析字符串并获取指定部分的内容
def parse_uri(url): import re parsed = re.match(r"^\w+?://(.+?):(.+?)$", url) return parsed.groups() if __name__ == '__main__': print(parse_uri("http://127.0.0.1:80"))
执行结果
('127.0.0.1', '80')
解析url得到ip和端口
也可以这样用,使用groupdict方法:
def parse_uri(url): import re parsed = re.match(r"^\w+?://(?P<host>.+?):(?P<port>.+?)$", url) # ?P<host>指定这个组的名称 return parsed.groupdict() # 获取字典类型 if __name__ == '__main__': print(parse_uri("http://localhost:8080"))
执行结果:
{'host': 'localhost', 'port': '8080'}