正则表达式

元字符
pip  Beautiful  Soup  美汤
import  re  导入
正则的功能:抓取,判断,过滤
 
.   就是匹配所有all 除了(\n)     转义(/.)用于中间有点的时候
[1-9]   [1,2,3]   [A,B,C]   [548932]   [9876543210]  匹配范围 区间
\d 匹配所有数字0-9 
\D 除去所有数字
\w 匹配单词字符 a-z, A-Z ,0-9, 下划线       用于匹配邮箱
\W 除去所有的字母数字 剩(#%)
\s 匹配空白 即空格,tab键
\S匹配非空白
str.strip()自动去除前后空格 
(163|QQ|) 配置表达式 | 是或者的意思
(?=  ) 向前查找
ret=re.match("^(?=.*[a-z])(?=.*[A-Z])(?=.*[0-9])[\w]{6}$",password)
修饰元字符
greed 贪婪 *  +
lazy  懒惰   ?
^a 定制必须是以a开头的
a$ 定制必须以a结尾
[^a] 排除a
 
(1) 不是元组 是数字1
(1,) 元组必须有逗号
@qq163|QQ|
(163|QQ|) 配置表达式 | 是或者的意思
 import  re
 ret=re.match("163","163.com") ##163是想要找的内容 ,从163.com里找想要的内容
 
 print(ret.group())
 
match 是从头开始匹配 否则报错
str=" "
a= re.compile(" ")
print(a.findall(str))
 1 import re
 2 # 键盘录入
 3 n=input("请输入网址:")
 4 ret=re.match(r"^(https://www)\.[0-9a-zA-Z]+\.(com)$",n)
 5 
 6 if ret:
 7     print("%s输入正确"%(ret.group()))
 8 
 9 else:
10     print("输入网址有误%s"%n)

# 匹配所有汉字
print(re.findall('[\u4e00-\u9fa5]', data))

# 匹配所有单字符,英文,数字,特殊符号
print(re.findall('[\x00-\xff]', data))

# 匹配所有非单字符,如汉字和省略号
print(re.findall('[^\x00-\xff]', data))

 

posted @ 2018-12-04 16:22  寒风孤影,江湖故人  阅读(121)  评论(0编辑  收藏  举报