re正则匹配基础
一.re模块
1.什么是正则?
正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。(在Python中)它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行。
我们现在配合着正则表达式来进行测试
1.字符串的常用操作:一对一匹配
s1 = 'paomo泡沫' print(s1.find('泡沫'))
2.正则匹配
\w 匹配中文,字母,数字,下划线
import re name = "泡沫-paomo_123 " print(re.findall("\w",name)) #结果['泡', '沫', 'p', 'a', 'o', 'm', 'o', '_', '1', '2', '3']
\W 不匹配中文,字母,数字,下划线
import re name = "泡沫-paomo_123 " print(re.findall("\W",name)) # 结果['-', ' ']
\s 匹配任意的空白符
import re name = "泡沫-paomo_123 " print(re.findall("\s",name)) # 结果 [' ']
\S 匹配不是任意的空白符
import re name = "泡沫-paomo_123 " print(re.findall("\S",name)) # 结果['泡', '沫', '-', 'p', 'a', 'o', 'm', 'o', '_', '1', '2', '3']
\d 匹配数字
import re name = "泡沫-paomo_123 " print(re.findall("\d",name)) # 结果 ['1', '2', '3']
\D 匹配非数字
import re name = "泡沫-paomo_123 " print(re.findall("\D",name)) # 结果['泡', '沫', '-', 'p', 'a', 'o', 'm', 'o', '_', ' ']
\A 与 ^ 从字符串开头匹配
import re name = "泡沫-paomo_123 " print(re.findall("\A泡沫",name)) # 结果['泡沫'] import re name = "泡沫-paomo_123 " print(re.findall("\A泡沫",name)) # 结果['泡沫']
\Z 与 \z 与 $ 字符串结尾匹配
import re name = "泡沫-paomo_123 " print(re.findall("123 \Z",name)) # 结果 ['123 '] import re name = "泡沫-paomo_123 " print(re.findall("123 \Z",name)) # 结果 ['123 '] import re name = "泡沫-paomo_123 " print(re.findall("123 $",name)) # 结果 ['123 ']
\n 与 \t 匹配换行符合制表符
import re name = "泡沫-paomo_123\t \n" print(re.findall("\n",name)) # 结果 ['\n'] import re name = "泡沫-paomo_123\t \n" print(re.findall("\t",name)) # 结果 ['\t']
\b \B
# \b \B # s = "alexwusiralex" # 边界 # print(re.findall(r"wusir\B",s)) # 非边界 #结果['wusir'] # s = "周芷若,周扒皮,刘周强,周宝元,八宝周,周八戒" # print(re.findall(r"\b周\w+",s)) #结果['周芷若', '周扒皮', '周宝元', '周八戒']