正则 re

正则表达式

程序员 —— 基本

爬虫方向必须牢固

介绍爬虫的基础

Re模块和正则表达式的关系

正则表达式本身是一种客观存在的规则,re模块是python提供的操作正则表达式的工具

正则表达式就是匹配字符串的一种规则

字符集 [ ]

量词:

1.     每一个量词只控制前一个字符的出现次数

2.     这个量词的匹配为贪婪匹配模式

3.     非贪婪匹配就是量词后面家问号

R取消python里 \ 的转义功能

      

re模块      返回值的区别

re.findall(’正则表达式’,’你要匹配的字符串’)直接返回匹配的列表,找不到为空列表

re.search()匹配找到的第一个结果,必须要print(.group)

re.match()自动加^重头开始匹配

在调用的角度上 本身没有区别:

    接受两个参数按照位置传  正则表达式的字符串和待匹配的字符串

分组:

    1.对多个字符进行整体的量词约束

    2. 对于一条匹配的正则,只对其中我需要的内容进行分组

 

posted @ 2017-09-11 16:00  敌说  阅读(94)  评论(0编辑  收藏  举报