python 正则表达式与re模块

正则表达式

正则表达式本身和python没有什么关系,是一种匹配字符串内容的一种规则


但是要讲re模块就必须了解正则表达式

字符组

首先,字符组是用中括号表示,中括号中是一个位置上可以出现的字符的范围

这个就是简单的字符组匹配,匹配字符串中1到9的数字然后返回,

返回的值是一个一个分开的,因为这个字符组检索的是一个单位上的要匹配的范围的元素

你要感兴趣,也可以自己去试试,这个就是在线测试工具http://tool.chinaz.com/regex/

当然,正则表达式还有很多匹配方式

这些和字符组一样使用,只要适当的组合,就能做到很多功能

当然 除了这些还有一些量词,帮助我们更好的匹配字符串

还有贪婪匹配,说的是正则在没有设定匹配多少的时候,都尽可能匹配更多的内容

re模块

说了这些正则,只是了解一下,最关键的还是讲re模块

首先说的是re模块下的常用方法

findall

ret = re.findall('', '阳光 太阳 阴阳')
print(ret)

['阳', '阳', '阳']

返回所有满足条件的结果,放在一个列表里,不论是汉字还是英文

这个看起来是不是方便有简单,还把返回的结果放在一个列表里,但是它却有一个缺点,不过这个稍后在说

search

ret = re.search('', '阳光 太阳 阴阳')
print(ret)

<_sre.SRE_Match object; span=(0, 1), match='阳'>

它返回的确实一个对象,所以想看到它返回的什么必须调用group()

ret = re.search('', '阳光 太阳 阴阳')
print(ret.group())

search的特点是,从前向后,找到一个就返回,并且返回的是一个变量,必须调用group()才能看见

match

ret = re.match('', '太阳 阳光 阴阳')
print(ret.group())

这个就报错了

ret = re.match('', '阳光 太阳 阴阳')
print(ret.group())

而这个就没问题了,原因是match和search一样,但是它是只在字符串的开头寻找,

如果没有就报错

 

posted @ 2018-01-09 17:05  GrandDarkness  阅读(137)  评论(0编辑  收藏  举报