正则 - 忘心 - 博客园

正则

re模块的使用：

import re

result = re.match(正则表达式，要匹配的字符串)

result.group()

正则表达式中忽略大小写需要在match中加入第三个参数 re.I

正则表达式中不识别中文需要在match中加入第三个参数 re.A （在\w中）等价于[a-zA-Z0-9_]

匹配单个字符：

\d 等价于一位数字（0-9）

[] 匹配括号内的任意一个（中间如果是连续的可以用 - 连接也可全部都例举出来）

. 任意一个相当于linux中的 *.py中的* 匹配不到换行\n re.S 可以匹配到换行需要在match中加入第三个参数

匹配多个字符：

{m} 匹配前一次字符出现多次

{m,n} 匹配前面字符出现从m到n次 n可以省略表示出现m到无限次 m必须大于n

？前面紧挨着的东西可有可无有只能给有一个

+ 前面字符必须至少有一个

* 前面字符可有可无 .* 前面字符任意一次

匹配开头结尾边界：

^ 匹配开头

$ 匹配结尾

如果在正则中要用某些普通的字符，比如逗号问号等需要在字符前添加一个反斜杠进行转义

匹配分组：

| 匹配左右任意一个

(ab) 将括号内的字符作为一个分组可以通过group(1) 查看

\num 引用分组num匹配到的字符串

re高级用法：

search 匹配次数匹配到第一个停止但不会从头开始匹配 match 从头开始匹配

findall 返回值为列表不需要用group查看匹配所有

sub 替换支持函数调用

spilt 根据匹配进行切割字符串，并返回一个列表

[^a] 只要不是a都满足

贪婪和非贪婪：

python 默认是贪婪的

？贪婪特性转成非贪婪相当于条件成立取最少的

r的使用：

r表示原生字符串

posted on 2018-12-06 20:28 忘心阅读(133) 评论(0) 收藏举报

刷新页面返回顶部