在自动化办公的时候,经常遇到需要通过正则表达式来处理文本。
1、环境是python, 开发工具是pycharm
2、需要导入re模块, 并且不需要安装,直接导入即可使用, 用到方法; ref.findall(patter, str)
3、简单语法介绍:
-- re.findall("aa", str) # 找找“aa”字符串
-- 查找除了换行以外的任何字符: .
-- 查询重复子: *: 代表0-多次重复,0次用“”表示
--查找重复字: + : 代表 1到多次重复
-- |: 代表或的关系: 查找aa 或者bb的字符:
-- []: 代表要匹配的字符,[0-9] 代表匹配0-9的数字;[a-z]: 代表匹配26个小写英文字符;[A-Z]: 代表匹配26个大写因为字符;[0-9a-zA-Z] 表示: 匹配0-数字26个大小写因为字符都会被找出来
-- {m, n}代表匹配几次:表示匹配m次,到n次, 最少m次,最大m次; 和这几个元字符比较相似: * 代表匹配{0,}; + 代表{1,};?代表:{0,1}
-- ?代表:{0,1}
-- 匹配一个手机号, 特性: 11位、数字, 1开头
--匹配非字符: ^
--匹配字符串的开头:^; 匹配字符串的结尾: $
-- ? : 代表匹配前面表达式0-1次,即前面是小写26个英文字母,加上?代表小写字符出现0-1次都属于匹配范围
--- \d\D \d:匹配任何数字字符 \D:匹配任意非字符数字
-- 匹配任意(非)普通字符: \w: 代表普通字符(比如:数字字母下划线汉字); \W:非普通 如:*&%¥#等
-- 匹配任意(非)空字符: \s: 匹配空字符 \S 匹配非空字符 说明: 空字符是指 空格\r\n\t\v\f字符
-- ()和[]的区别:()作为一个整体, [] 是包含其中一个即可
-- re.match介绍:
返回对象的方法介绍:
--re.research介绍