在自动化办公的时候,经常遇到需要通过正则表达式来处理文本。

 

1、环境是python, 开发工具是pycharm

2、需要导入re模块, 并且不需要安装,直接导入即可使用, 用到方法; ref.findall(patter, str)

3、简单语法介绍:

-- re.findall("aa", str)  # 找找“aa”字符串

 -- 查找除了换行以外的任何字符: .  

 

 -- 查询重复子: *: 代表0-多次重复,0次用“”表示

--查找重复字: + : 代表 1到多次重复

 

 -- |: 代表或的关系: 查找aa 或者bb的字符:

 -- []: 代表要匹配的字符,[0-9] 代表匹配0-9的数字;[a-z]: 代表匹配26个小写英文字符;[A-Z]: 代表匹配26个大写因为字符;[0-9a-zA-Z] 表示: 匹配0-数字26个大小写因为字符都会被找出来

 -- {m, n}代表匹配几次:表示匹配m次,到n次, 最少m次,最大m次; 和这几个元字符比较相似: * 代表匹配{0,}; + 代表{1,};?代表:{0,1}

-- ?代表:{0,1}

 -- 匹配一个手机号, 特性: 11位、数字, 1开头

 --匹配非字符: ^

 --匹配字符串的开头:^; 匹配字符串的结尾: $

 

 

--  ? : 代表匹配前面表达式0-1次,即前面是小写26个英文字母,加上?代表小写字符出现0-1次都属于匹配范围

 

 --- \d\D \d:匹配任何数字字符 \D:匹配任意非字符数字

 

 -- 匹配任意(非)普通字符: \w: 代表普通字符(比如:数字字母下划线汉字); \W:非普通 如:*&%¥#等

 

 --   匹配任意(非)空字符: \s: 匹配空字符 \S 匹配非空字符 说明: 空字符是指 空格\r\n\t\v\f字符

 -- ()和[]的区别:()作为一个整体, [] 是包含其中一个即可

 -- re.match介绍:

 

 

返回对象的方法介绍:

 

 

 --re.research介绍

 

posted on 2021-01-10 14:15  北京-默默  阅读(138)  评论(0编辑  收藏  举报