正则表达式

单词:abs sdd 123 dsd54 是四个单词
字符串:abs sdd 123 dsd54是一个字符串,之间即使换行,依然是一个字符串

\b:单词的开头或结尾,不代表任何东西,指示标志位置,单词智能包括数字、字母、汉字等,不包括特殊字符
^ :字符串的开头
$:字符串的结尾

\d 匹配一位数字
\d{5}匹配若干数字

\b\d{5}\b 仅仅匹配五位数字(两侧不允许有内容)
\b\d{5,8}\b 匹配5-8位数字
\b\d{5,}\b 匹配大于5位数字

. 匹配除了换行符以外的任意字符 111...
* 代表它前面的部分重复任意多次,可能为0次
+ 代表前面的部分重复任意次,不可能为0次
? 代表前面的部分0次或1次

\s 匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等
\w 匹配字母或数字或下划线或汉字等
() 分组括号里作为一个整体
| 或

[范围] 某个范围的字符[0-9][a-z][A-Z]

\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置

[^范围]匹配除了范围以外的任意字符

(?=条件) 零宽断言(后匹配)
(?<条件) 零宽断言(前匹配)
(?!条件) 负向零宽断言(后匹配)
(?<!条件) 负向零宽断言(前匹配)

 

 

 

 

内容来源于b站视频:3小时学会python办公自动化,3分钟完成1天的工作!

posted @ 2022-05-12 10:54  尼古拉-卡什  阅读(27)  评论(0编辑  收藏  举报