摘要: 正则表达式(regular expression)是一个特殊的字符序列,描述了一种字符串匹配的模式,可以用来检查一个字符串是否含有某种子字符串。 将匹配的子字符串替换或者从某个字符串中取出符合某个条件的子字符串,或者是在指定的文章中抓取特定的字符串等。 Python处理正则表达式的模块是re模块,它 阅读全文
posted @ 2019-04-24 10:25 あなたの相棒 阅读(609) 评论(0) 推荐(0) 编辑
摘要: 无名、有名分组 (1)正则表达式—无名分组 从正则表 达式的左边开始看,看到的第一个左括号“(”表示表示第一个分组,第二个表示第二个分组, 依次类推。 需要注意的是,有一个隐含的全局分组(就是索引号为0的分组),就是整个正则 表达式匹配的结果 (2)正则表达式—有名分组 命名分组就是给具体有默认分组 阅读全文
posted @ 2019-04-24 10:24 あなたの相棒 阅读(737) 评论(0) 推荐(0) 编辑
摘要: 1.re.split 语法: re.split(pattern, string[, maxsplit=0, flags=0]) 参数: pattern 匹配的正则表达式 string 要匹配的字符串。 maxsplit 分隔次数,maxsplit=1 分隔一次,默认为 0,不限制次数。 >>>imp 阅读全文
posted @ 2019-04-24 10:23 あなたの相棒 阅读(345) 评论(0) 推荐(0) 编辑
摘要: 正则表达式—修饰符 正则表达式可以包含一些标志修饰符来控制匹配模式,用在正则表达式处理函数中的flag参数中,为可选参数。 (1) re.I 全写(re.IGNORECASE) 表示使匹配时,忽略大小 (2) re.M 全写(re.MULTILINE) 多行匹配,影响 ^ 和 $的行为 (3) re 阅读全文
posted @ 2019-04-24 10:23 あなたの相棒 阅读(391) 评论(0) 推荐(0) 编辑
摘要: findall方法 相比其他方法,findall方法有些特殊。它的作用是查找字符串中所有能匹配的字符串,并以结果存于列表中,然后返回该列表 注意: match 和 search 是匹配一次 findall 匹配所有。 1 pattern.findall方法 该方法的作用是在string[pos, e 阅读全文
posted @ 2019-04-24 10:22 あなたの相棒 阅读(531) 评论(0) 推荐(0) 编辑
摘要: 1.re.match函数 re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回None。 (1)函数语法: 函数参数说明: pattern 匹配的正则表达式 string 要匹配的字符串 flgs 标志位,用于控制正则表达式的匹配方式 我们可以使用 阅读全文
posted @ 2019-04-24 10:21 あなたの相棒 阅读(1042) 评论(0) 推荐(0) 编辑
摘要: 编译正则表达式-- re.compile 使用re的一般步骤是先将正则表达式的字符串形 式编译为pattern实例,然后使用pattern实例处理文本并获取匹配结果(一个Match实例(值为True)),最后使用Match实例获取信息,进行其他的操作。 可以把那些经常使用的正则表达式编译成正则表达式 阅读全文
posted @ 2019-04-24 10:19 あなたの相棒 阅读(915) 评论(0) 推荐(0) 编辑
摘要: 正则表达式—特殊表达式含义 正则表达式的字母和数字表示他们自身,但多数字母和数字前加一个反斜杠时会拥有不同的含义。 下面列出了正则表达式模式语法中的特殊元素。 1.普通字符集 1) \w 匹配字母数字及下划线 2) \W 匹配非字母数字及下划线 3) \s 匹配任意空白字符,等价于 [\t\n\r\ 阅读全文
posted @ 2019-04-24 10:18 あなたの相棒 阅读(6091) 评论(0) 推荐(0) 编辑