python中使用正则表达式

1. re模块的介绍

在Python中需要通过正则表达式对字符串进行匹配的时候,可以使用一个 re 模块

# 导入re模块
import re

# 使用match方法进行匹配操作
result = re.match(正则表达式,要匹配的字符串)

# 如果上一步匹配到数据的话,可以使用group方法来提取数据
result.group()

 

2. re模块的使用

import re


# 使用match方法进行匹配操作
result = re.match("ab.c", "abdcn")
# 获取匹配结果
if result:
    info = result.group()
    print(info)
else:
    print("没匹配上")

 

说明:

  • re.match()方法如果匹配到字符串,返回得时一个<re.Match object; span=(0, 3), match='tow'>, 没有匹配到则为None, 因此可用if判断释放匹配到

运行结果:

itcast

 3. 解析字符串并获取指定部分的内容

def parse_uri(url):
    import re
    parsed = re.match(r"^\w+?://(.+?):(.+?)$", url)
    return parsed.groups()


if __name__ == '__main__':
    print(parse_uri("http://127.0.0.1:80"))

执行结果

('127.0.0.1', '80')

解析url得到ip和端口

也可以这样用,使用groupdict方法:

def parse_uri(url):
    import re
    parsed = re.match(r"^\w+?://(?P<host>.+?):(?P<port>.+?)$", url)     # ?P<host>指定这个组的名称
    return parsed.groupdict()   # 获取字典类型


if __name__ == '__main__':
    print(parse_uri("http://localhost:8080"))

执行结果:

{'host': 'localhost', 'port': '8080'}

 

posted @ 2021-01-07 22:42  foreast  阅读(119)  评论(0编辑  收藏  举报