re正则--匹配方法

--re.match()方法

语法:re.match(pattern,string,flags) 

其中flags表示的标志位。有以下几种

re.I 忽略大小写
re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
re.M 多行模式
re.S 即为 . 并且包括换行符在内的任意字符(. 不包括换行符)
re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
re.X 为了增加可读性,忽略空格和

re.match方法:尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match() 就返回 none。

import re
url = 'https://www.baidu.com'
result = re.match('http',url).span()
print(result)

 

 

 不是从头开始匹配的,直接返回None

import re
url = 'https://www.baidu.com'
result = re.match('www',url)
print(result)

 

---re.search()方法

re.search(pattern,string,flags) 扫描整个字符串并返回第一个成功的匹配,和re.match区别是全字符串匹配,不限于头部。

import re
url = 'https://WWW.baidu.com'
result = re.search('www',url,flags=re.I)
print(result)

 

 

 

--re.split()

 re.spilit()方法按照能够匹配的子串将字符串分割后返回列表

语法:split(pattern, string, maxsplit=0, flags=0)

复制代码
import re
url = 'https://WWW.baidu.com,https://www.taobao.com'
result = re.split(',',url,flags=re.I)
print(result)

 

 

复制代码

 

 

----re.sub()

匹配字符并且进行替换

语法:sub(pattern, repl, string, count=0, flags=0)

import re
url = 'https://WWW.baidu.com,https://www.taobao.com'
result = re.sub('com','cn',url,flags=re.I)
print(result)

 

--re.findall()

re.findall()用法与其他一样,与re.match和re.search不同的是,re.findall可以匹配多个,用()括起来,返回一个列表,列表的内容就是()内匹配到的字符

import re
url = 'https://WWW.baidu.com,https://www.taobao.com'
result = re.findall('(.*?)//',url,flags=re.I)
print(result)
posted @   powfu  阅读(709)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示