正则表达式的总结

\d 可以匹配数字

\w可以匹配字母或数字

*表示任意一个字符(包括0个)

+表示至少一个字符

?表示0个或1个字符

{n}表示n个字符

{n,m}表示n-m个字符

\s可以匹配一个空格(也可以是Tab)

\s+表示至少一个空格

[0-9a-zA-Z\_]可以匹配一个数字 字母 下划线

[0-9a-zA-Z\_]+可以匹配至少一个数字 字母 下划线组成的字符串

[a-zA-Z\_][0-9a-zA-Z\-]*可以匹配又字母和下划线开头,后面由一个数字 字母 下划线组成的字符串

[a-zA-Z\_][0-9a-zA-Z\_]{0-19}更精确的限制连变量的长度是1-20个字符

A|B可以匹配A或B

^表示行的开头,^\d表示必须以数字开头

$表示行结束,\d$表示必须以数字结束

 

利用split()切割

 

re.split(r'[\s,\;\d]+','string)

 

posted @ 2017-05-20 17:28  陈博凯  阅读(173)  评论(0编辑  收藏  举报