- 正则表达式,一种独立的规则和语言,主要和字符串打交道
- 表单验证,检测一个字符串是否完全符合规则,先通过正则去判断是否符合规则,符合规则再去请求
- 字符组
- 根据ascii码表从小到大顺序匹配,可以一次取多个区间
- 元字符
- \w匹配所有的数字[0-9]大小写字母[a-z,A-Z]下划线_
- ()分组,一般结合|一起用 类比一下Python的逻辑or
- 量词
- 贪婪匹配------->尽可能多的匹配,用?阻止贪婪
- 惰性匹配------->符合条件基础上尽量少的匹配(量词后面的?表示惰性匹配)
- 只写元字符,一个元字符表示一位字符上的内容
- 元字符量词结构,量词只约束前面一个元字符
- re模块 配合正则表达式使用python-常用模块 - 断浪狂刀忆年少 - 博客园 (cnblogs.com)
![]()
![]()
- re.findall('\w+',s)第一个参数是正则的规则,第二个参数是要匹配的字符串,findall匹配所有匹配项
- re.search('\d+',s)只匹配从左到右符合条件的第一项,返回的是一个对象,通过.group()方法取值
- re.match()相当于默认给开头加了^号,返回的是一个对象,通过.group()方法取值、
- re.compile()预编译,正则需要编译,预编译可以节省时间,爬虫使用多
- re.finditer()节省空间,变成迭代器,通过.group()方法取值、
- 比较好用的匹配公式 #(.+?)#
posted @
2023-05-13 19:57
3notblv
阅读(
20)
评论()
收藏
举报