python之路--内置函数03

一 . 正则表达式匹配字符串

　　元字符
　　. 除了换行
　　\w 数字, 字母, 下划线
　　\d 数字
　　\s 空白符
　　\n
　　\t
　　\b 单词的边界
　　\W 非xxx
　　\D
　　\S
　　[ ] 字符组 or的关系
　　[^xxx] 非xxxx
　　^ 字符串的开始
　　$ 字符串的结束
　　| 或者

　　' ' 啥都能匹配
量词
　　* 0->n
　　+ 1->n
　　? 0->1
　　{p} p次
　　{p,q} p->q次
　　{p,} 至少p次

贪婪和惰性
　　.*
　　.+
　　惰性:
　　.*?宝宝 尽可能少的匹配

转义 \\\\n => \\n => \n
　　正则前面加r

分组 ()

二 . 在python中使用正则. re

　　(?P<name>正则)
　　1. search() 搜索. 搜索到第一个结果返回

import re
# search 搜索, 查找
# 一旦匹配到结果. 直接返回, 如果匹配不到结果. 返回None
result = re.search("\d+", "宝宝45的电话是123")
print(result) # <_sre.SRE_Match object; span=(6, 9), match='123'>
print(result.group()) # 45

　　2. match() 匹配. 收到一个结果返回. 从头开始匹配

import re
# 匹配, 从头开始匹配. 相当于在你正则前面加了一个^
result = re.match("\d+", "434宝宝的电话是:")
print(result.group())  # 434

# search和match的区别:  search查找. 找到了结果就返回. match. 从头开始匹配.

　　3. findall() 查找所有匹配结果

import re
result = re.findall("\d+", "baby的电话号是: 185123456789")
print(result) # ['185123456789']

　　4. finditer() 返回迭代器.

import re
it = re.finditer("\d+", "baby123456789的电话号是: 185123456789")
for el in it:
    print(el.group()) # 分组  123456789   185123456789

　　5. compile() 编译
　　6. group("name") 获取数据
　　7. re.S 干掉 . 的换行

posted @ 2018-12-28 21:52 一个很善良的抱爱阅读(178) 评论(0) 收藏举报

刷新页面返回顶部

一个很善良的抱爱

python之路--内置函数03

一 . 正则表达式 匹配字符串

二 . 在python中使用正则. re

公告

一 . 正则表达式匹配字符串