python爬虫(二十二) 正则表达式匹配多个字符
一、1、* :匹配0个或者任意多个字符
text="1234" ret=re.match('\d*',text) print(ret.group()) >>1234
2、+:匹配一个或多个字符
text="abcd" ret=re.match('\w+',text) print(ret.group()) >>abcd
3、?:匹配0个或者1个字符
text="abcd" ret=re.match('\w?',text) print(ret.group()) >>a
4、{m}:匹配m个字符
text="abcd" ret=re.match('\w{2}',text) print(ret.group()) >>ab
5、{m,n}:匹配m到n个字符
text="abcd" ret=re.match('\w{1,5}',text) //匹配一个、两个、三个到五个都行 print(ret.group()) >>abcd
二、验证手机号
text="180123456789" ret=re.match('1[34578]\d{9}',text) print(ret.group())
>>180123456789
三、验证邮箱
text="2605072149@qq.com" ret=re.match('\w+@[a-z0-9]+\.[a-z]+',text) print(ret.group())
>>2605072149@qq.com
四、验证url
text="https://baike.baidu.com/item/Python/407313?fr=aladdin" ret=re.match('(http|https|ftp)://[^\s]+',text) print(ret.group())
五、验证身份证
text="311111222222111445" ret=re.match('\d{17}[\dxX]',text) print(ret.group())