正则表达式
正则是用一些具有特殊含义的符号组合在一起来描述字符或者字符串的方法,这些特殊符号组合在一起称为正则表达式,正则说白了就是一种规则。
正则本质上是一种小型的编程语言,它内嵌在Python中并通过re模块实现
1.元字符
在正则表达式中一共有11个元字符:
. ^ $ * + ? {} [] () \ |
1) . 代表除换行符之外的任意一个符号,(如果想代表换行符也有办法,就是在方法的参数中,更改模式为re.S)
2)^ 代表以什么开头
3) $ 代表以什么结尾,如果^ . $就表示从头匹配到尾,完全匹配
4) * + ? {}
这几个都表示重复,
*表示前面的字符重复零到无穷次
+表示前面的字符重复一到无穷次
? 表示前面的字符重复零或一次
{} 大括号里可以指定数字,表示重复多少次,或者指定一个范围,表示重复这个范围的次数