正则表达式
单词:abs sdd 123 dsd54 是四个单词
字符串:abs sdd 123 dsd54是一个字符串,之间即使换行,依然是一个字符串
\b:单词的开头或结尾,不代表任何东西,指示标志位置,单词智能包括数字、字母、汉字等,不包括特殊字符
^ :字符串的开头
$:字符串的结尾
\d 匹配一位数字
\d{5}匹配若干数字
\b\d{5}\b 仅仅匹配五位数字(两侧不允许有内容)
\b\d{5,8}\b 匹配5-8位数字
\b\d{5,}\b 匹配大于5位数字
. 匹配除了换行符以外的任意字符 111...
* 代表它前面的部分重复任意多次,可能为0次
+ 代表前面的部分重复任意次,不可能为0次
? 代表前面的部分0次或1次
\s 匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等
\w 匹配字母或数字或下划线或汉字等
() 分组括号里作为一个整体
| 或
[范围] 某个范围的字符[0-9][a-z][A-Z]
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^范围]匹配除了范围以外的任意字符
(?=条件) 零宽断言(后匹配)
(?<条件) 零宽断言(前匹配)
(?!条件) 负向零宽断言(后匹配)
(?<!条件) 负向零宽断言(前匹配)
内容来源于b站视频:3小时学会python办公自动化,3分钟完成1天的工作!