python之路--内置函数03

一 . 正则表达式 匹配字符串

  元字符
  . 除了换行
  \w 数字, 字母, 下划线
  \d 数字
  \s 空白符
  \n
  \t
  \b 单词的边界
  \W 非xxx
  \D
  \S
  [ ] 字符组 or的关系
  [^xxx] 非xxxx
  ^ 字符串的开始
  $ 字符串的结束
  | 或者

  ' ' 啥都能匹配
量词
  * 0->n
  + 1->n
  ? 0->1
  {p} p次
  {p,q} p->q次
  {p,} 至少p次

贪婪和惰性
  .*
  .+
  惰性:
  .*?宝宝 尽可能少的匹配

转义 \\\\n => \\n => \n
  正则前面加r

分组 ()

 

二 . 在python中使用正则. re

  (?P<name>正则)
  1. search() 搜索. 搜索到第一个结果返回

import re
# search 搜索, 查找
# 一旦匹配到结果. 直接返回, 如果匹配不到结果. 返回None
result = re.search("\d+", "宝宝45的电话是123")
print(result) # <_sre.SRE_Match object; span=(6, 9), match='123'>
print(result.group()) # 45

 

  2. match() 匹配. 收到一个结果返回. 从头开始匹配

import re
# 匹配, 从头开始匹配. 相当于在你正则前面加了一个^
result = re.match("\d+", "434宝宝的电话是:")
print(result.group())  # 434

 

# search和match的区别:  search查找. 找到了结果就返回. match. 从头开始匹配.


  3. findall() 查找所有匹配结果

import re
result = re.findall("\d+", "baby的电话号是: 185123456789")
print(result) # ['185123456789']

 

  4. finditer() 返回迭代器.

import re
it = re.finditer("\d+", "baby123456789的电话号是: 185123456789")
for el in it:
    print(el.group()) # 分组  123456789   185123456789

 

  5. compile() 编译
  6. group("name") 获取数据
  7. re.S 干掉 . 的换行

 

posted @ 2018-12-28 21:52  一个很善良的抱爱  阅读(164)  评论(0编辑  收藏  举报