python爬虫(二十二) 正则表达式匹配多个字符

一、1、* :匹配0个或者任意多个字符

text="1234"
ret=re.match('\d*',text)
print(ret.group())
>>1234

2、+:匹配一个或多个字符

 

text="abcd"
ret=re.match('\w+',text)
print(ret.group())
>>abcd

 

3、?:匹配0个或者1个字符

text="abcd"
ret=re.match('\w?',text)
print(ret.group())
>>a

4、{m}:匹配m个字符

text="abcd"
ret=re.match('\w{2}',text)
print(ret.group())
>>ab

5、{m,n}:匹配m到n个字符

text="abcd"
ret=re.match('\w{1,5}',text)  //匹配一个、两个、三个到五个都行
print(ret.group())
>>abcd

二、验证手机号

text="180123456789"
ret=re.match('1[34578]\d{9}',text)
print(ret.group())
>>180123456789

三、验证邮箱

text="2605072149@qq.com"
ret=re.match('\w+@[a-z0-9]+\.[a-z]+',text)
print(ret.group())
>>2605072149@qq.com

四、验证url

text="https://baike.baidu.com/item/Python/407313?fr=aladdin"
ret=re.match('(http|https|ftp)://[^\s]+',text)
print(ret.group())

 

 五、验证身份证

text="311111222222111445"
ret=re.match('\d{17}[\dxX]',text)
print(ret.group())

 

posted on 2020-03-12 17:43  方木Fengl  阅读(4281)  评论(0编辑  收藏  举报

导航