Python 正则表达式 re 模块(转载)

Python 正则表达式

正则表达式

需要使用 re 模块, re 模块用于对 python 的正则表达式的操作

语法

#导入模块名
import re
 
# 生成要匹配的正则对象 , ^代表从开头匹配,[0-9]代表匹配0至9的任意一个数字, 所以这里的意思是对传进来的字符串进行匹配,如果这个字符串的开头第一个字符是数字,就代表匹配上了
p = re.compile("^[0-9]") 
 
# 按上面生成的正则对象 去匹配 字符串,如果能匹配成功,这个 m 就会有值,否则 m 为 None
m = p.match('14534Abc') 

if m: 
    # 不为空代表匹配上了 m.group()返回匹配上的结果,此处为1,因为匹配上的是1这个字符
    print(m.group())
else:
    print("doesn't match.")

上面的 第2行 和 第3行 代码也可以合并成一行来写:

m = p.match("^[0-9]",'14534Abc')

效果是一样的,区别在于

  • 第一种方式是提前对要匹配的格式进行了编译(对匹配公式进行解析),这样再去匹配的时候就不用在编译匹配的格式
  • 第二种简写是每次匹配的时候都要进行一次匹配公式的编译
  • 所以,如果你需要从一个5w行的文件中匹配出所有以数字开头的行,建议先把正则公式进行编译再匹配,这样速度会快点

正则表达式元字符

字符匹配

.       :除换行符以外的任意单个字符
[]      :指定范围内字符
[^]     :指定范围外字符

次数匹配

*       :任意次,01,多次
.*      :任意字符 任意次
?       :至多1次或0次
+       :至少出现1次或多次
{m}     :其前面字符出现m次
{m,n}   :其前面字符出现至少m次,至多n次
{m,}    :其前面字符出现至少m次
{,n}    :其前面字符出现至多n次

位置锚定

^       :匹配字符串的开头
$       :匹配字符串的末尾

分组及引用

()      :分组,括号内模式会被记录于正则表达式引擎
后向引用 :\1  \2  \3.....  

a|b     :a或者b
C|cat   :C或cat
(C|c)at :Cat或cat

转义字符

\w      :匹配字母数字
\W      :匹配非字母数字
\s      :匹配任意空白字符,等价于 [\t\n\r\f].
\S      :匹配任意非空字符
\d      ;匹配任意数字,等价于 [0-9].
\D      :匹配任意非数字
\A      :匹配字符串开始
\Z      :匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串
\z      :匹配字符串结束
\G      :匹配最后匹配完成的位置。
\b      :匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
\B      :匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
\n      :匹配一个换行符
\t      :匹配一个制表符
\1...\9 :匹配第n个分组的子表达式

正则表达式常用5种操作

re.match(pattern, string, flags=0)

从起始位置开始根据模型去字符串中匹配指定内容,匹配单个

  • 正则表达式
  • 要匹配的字符串
  • 标志位,用于控制正则表达式的匹配方式
import re
 
obj = re.match('\d+', '957evescn')
if obj:
    print(obj.group())
 
# 输出结果
957
# flags
I = IGNORECASE = sre_compile.SRE_FLAG_IGNORECASE # ignore case
L = LOCALE = sre_compile.SRE_FLAG_LOCALE # assume current 8-bit locale
U = UNICODE = sre_compile.SRE_FLAG_UNICODE # assume unicode locale
M = MULTILINE = sre_compile.SRE_FLAG_MULTILINE # make anchors look for newline
S = DOTALL = sre_compile.SRE_FLAG_DOTALL # make dot match newline
X = VERBOSE = sre_compile.SRE_FLAG_VERBOSE # ignore whitespace and comment

re.search(pattern, string, flags=0)

匹配整个字符串,返回第一个符合条件的匹配

import re
 
obj = re.search('\d+', 'gmkk957evescn')
if obj:
    print(obj.group())
 
# 输出结果
957

group和groups

  • group() 方法用于返回整个匹配的字符串或指定组的匹配字符串。如果没有指定组号,则默认返回整个匹配的字符串
  • groups() 方法用于返回一个包含所有组匹配字符串的元组。示例代码如下
import re
 
a = "123abc456"
print(re.search("([0-9]*)([a-z]*)([0-9]*)", a).group())
 
print(re.search("([0-9]*)([a-z]*)([0-9]*)", a).group(0))
print(re.search("([0-9]*)([a-z]*)([0-9]*)", a).group(1))
print(re.search("([0-9]*)([a-z]*)([0-9]*)", a).group(2))
print(re.search("([0-9]*)([a-z]*)([0-9]*)", a).group(3))
 
print(re.search("([0-9]*)([a-z]*)([0-9]*)", a).groups())
 
# 输出结果
123abc456
 
123abc456
123
abc
456
 
('123', 'abc', '456')

re.findall(pattern, string, flags=0)

找到所有要匹配的字符并返回列表格式

import re
 
obj = re.findall('\D+', 'evescn666gmkk')
print(obj)
 
# 输出结果
['evescn', 'gmkk']

re.sub(pattern, repl, string, count=0, flags=0)

替换匹配到的字符

import re
 
content = "123abc456"
new_content = re.sub('\d+', 'sb', content)
# new_content = re.sub('\d+', 'sb', content, 1)
print(new_content)
 
# 输出结果
sbabcsb

相比于str.replace功能更加强大

re.split(pattern, string, maxsplit=0, flags=0)

将匹配到的格式当做分割点对字符串分割成列表

import re
 
content = '1 - 2 * ((60-30+1*(9-2*5/3+7/3*99/4*2998+10*568/14))-(-4*3)/(16-3*2) )'
new_content = re.split('\*', content)
# new_content = re.split('\*', content, 1)
print(new_content)
 
###### 输出结果
['1 - 2 ', ' ((60-30+1', '(9-2', '5/3+7/3', '99/4', '2998+10', '568/14))-(-4', '3)/(16-3', '2) )']
['1 - 2 ', ' ((60-30+1*(9-2*5/3+7/3*99/4*2998+10*568/14))-(-4*3)/(16-3*2) )']
######
 
content = '1 - 2 * ((60-30+1*(9-2*5/3+7/3*99/4*2998+10*568/14))-(-4*3)/(16-3*2) )'
new_content = re.split('[\+\-\*\/]+', content)
# new_content = re.split('[\+\-\*\/]+', content, 1)
print(new_content)
 
###### 输出结果
['1 ', ' 2 ', ' ((60', '30', '1', '(9', '2', '5', '3', '7', '3', '99', '4', '2998', '10', '568', '14))', '(', '4', '3)', '(16', '3', '2) )']
['1 ', ' 2 * ((60-30+1*(9-2*5/3+7/3*99/4*2998+10*568/14))-(-4*3)/(16-3*2) )']
######
 
inpp = '1-2*((60-30 +(-40-5)*(9-2*5/3 + 7 /3*99/4*2998 +10 * 568/14 )) - (-4*3)/ (16-3*2))'
inpp = re.sub('\s*', '', inpp)
print(inpp)
 
new_content = re.split('\(([\+\-\*\/]?\d+[\+\-\*\/]?\d+){1}\)', inpp, 1)
print(new_content)
 
###### 输出结果
1-2*((60-30+(-40-5)*(9-2*5/3+7/3*99/4*2998+10*568/14))-(-4*3)/(16-3*2))
['1-2*((60-30+', '-40-5', '*(9-2*5/3+7/3*99/4*2998+10*568/14))-(-4*3)/(16-3*2))']
######  

几个常见正则例子

匹配手机号

import re
 
phone_str = "my name is evescn, and my phone number is 18111555666"
 
m = re.search("(1)([358]\d{9})",phone_str)
if m:
    print(m.group())
 
# 输出结果
18111555666

匹配IPv4

ip_addr = "inet 172.19.133.212 brd 172.19.143.255"
  
m = re.search("(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.(25[0-5]|2[0-4]\d|[0-1]?\d?\d)){3}", ip_addr)
  
print(m.group())
 
# 输出结果
172.19.133.212

分组匹配地址

contactInfo = 'Evescn, ChengDu: 028-8888888'
 
#分组
match = re.search(r'(\w+), (\w+): (\S+)', contactInfo)
"""
>>> match.group(1)
  'Evescn'
>>> match.group(2)
  'ChengDu'
>>> match.group(3)
  '028-8888888'
"""
 
match = re.search(r'(?P<name>\w+), (?P<addr>\w+): (?P<phone>\S+)', contactInfo)
"""
>>> print(match.group('name'))
  'Evescn'
>>> print(match.group('addr'))
  'ChengDu'
>>> print(match.group('phone'))
  '028-8888888'
"""

匹配email

email = "evescn.gmkk@163.com   http://blog.evescn.com"
 
m = re.search(r"[0-9.a-z]{0,26}@[0-9.a-z]{0,20}.[0-9a-z]{0,8}", email)
print(m.group())
 
# 输出结果
evescn.gmkk@163.com

转载自

http://www.cnblogs.com/alex3714/articles/5143440.html
posted @   evescn  阅读(28)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· Vue3状态管理终极指南:Pinia保姆级教程
  1. 1 毛不易
  2. 2 青丝 等什么君(邓寓君)
  3. 3 最爱 周慧敏
  4. 4 青花 (Live) 摩登兄弟刘宇宁/周传雄
  5. 5 怨苍天变了心 葱香科学家(王悠然)
  6. 6 吹梦到西洲 恋恋故人难/黄诗扶/王敬轩(妖扬)
  7. 7 姑娘别哭泣 柯柯柯啊
  8. 8 我会好好的 王心凌
  9. 9 半生雪 七叔-叶泽浩
  10. 10 用力活着 张茜
  11. 11 山茶花读不懂白玫瑰 梨笑笑
  12. 12 赴春寰 张壹ZHANG/Mukyo木西/鹿予/弦上春秋Official
  13. 13 故事终章 程响
  14. 14 沿海独白 王唯一(九姨太)
  15. 15 若把你 越南电音 云音乐AI/网易天音
  16. 16 世间美好与你环环相扣 柏松
  17. 17 愿你如愿 陆七言
  18. 18 多情种 胡杨林
  19. 19 和你一样 李宇春
  20. 20 晚风心里吹 李克勤
  21. 21 世面 黄梓溪
  22. 22 等的太久 杨大六
  23. 23 微醺状态 张一
  24. 24 醉今朝 安小茜
  25. 25 阿衣莫 阿吉太组合
  26. 26 折风渡夜 沉默书生
  27. 27 星河万里 王大毛
  28. 28 满目星辰皆是你 留小雨
  29. 29 老人与海 海鸣威/吴琼
  30. 30 海底 一支榴莲
  31. 31 只要有你 曹芙嘉
  32. 32 兰花指 阿里郎
  33. 33 口是心非 张大帅
  34. 34 爱不得忘不舍 白小白
  35. 35 惊鸿醉 指尖笑
  36. 36 如愿 葱香科学家(王悠然)
  37. 37 晚风心里吹 阿梨粤
  38. 38 惊蛰·归云 陈拾月(只有影子)/KasaYAYA
  39. 39 风飞沙 迪克牛仔
  40. 40 把孤独当做晚餐 井胧
  41. 41 星星点灯 郑智化
  42. 42 客子光阴 七叔-叶泽浩
  43. 43 走马观花 王若熙
  44. 44 沈园外 阿YueYue/戾格/小田音乐社
  45. 45 盗将行 花粥/马雨阳
  46. 46 她的眼睛会唱歌 张宇佳
  47. 47 一笑江湖 姜姜
  48. 48 虎二
  49. 49 人间烟火 程响
  50. 50 不仅仅是喜欢 萧全/孙语赛
  51. 51 你的眼神(粤语版) Ecrolyn
  52. 52 剑魂 李炜
  53. 53 虞兮叹 闻人听書_
  54. 54 时光洪流 程响
  55. 55 桃花诺 G.E.M.邓紫棋
  56. 56 行星(PLANET) 谭联耀
  57. 57 别怕我伤心 悦开心i/张家旺
  58. 58 上古山海经 小少焱
  59. 59 你的眼神 七元
  60. 60 怨苍天变了心 米雅
  61. 61 绝不会放过 王亚东
  62. 62 可笑的孤独 黄静美
  63. 63 错位时空 艾辰
  64. 64 像个孩子 仙屁孩
  65. 65 完美世界 [主题版] 水木年华
  66. 66 我们的时光 赵雷
  67. 67 万字情诗 椒椒JMJ
  68. 68 妖王 浮生
  69. 69 天地无霜 (合唱版) 杨紫/邓伦
  70. 70 塞北殇 王若熙
  71. 71 花亦山 祖娅纳惜
  72. 72 醉今朝 是可乐鸭
  73. 73 欠我个未来 艾岩
  74. 74 缘分一道桥 容云/青峰AomineDaiky
  75. 75 不知死活 子无余/严书
  76. 76 不可说 霍建华/赵丽颖
  77. 77 孤勇者 陈奕迅
  78. 78 让酒 摩登兄弟刘宇宁
  79. 79 红尘悠悠DJ沈念版 颜一彦
  80. 80 折风渡夜 (DJ名龙版) 泽国同学
  81. 81 吹灭小山河 国风堂/司南
  82. 82 等什么君 - 辞九门回忆 张大帅
  83. 83 绝世舞姬 张曦匀/戚琦
  84. 84 阿刁(无修音版|live) 张韶涵网易云资讯台
  85. 85 往事如烟 蓝波
  86. 86 清明上河图 李玉刚
  87. 87 望穿秋水 坤坤阿
  88. 88 太多 杜宣达
  89. 89 小阿七
  90. 90 霞光-《精灵世纪》片尾曲 小时姑娘
  91. 91 放开 爱乐团王超
  92. 92 醉仙美 娜美
  93. 93 虞兮叹(完整版) 黎林添娇kiki
  94. 94 单恋一枝花 夏了个天呐(朴昱美)/七夕
  95. 95 一个人挺好 (DJ版) 69/肖涵/沈子凡
  96. 96 一笑江湖 闻人听書_
  97. 97 赤伶 李玉刚
  98. 98 达拉崩吧 (Live) 周深
  99. 99 等你归来 程响
  100. 100 责无旁贷 阿悠悠
  101. 101 你是人间四月天(钢琴弹唱版) 邵帅
  102. 102 虐心 徐良/孙羽幽
  103. 103 大天蓬 (女生版) 清水er
  104. 104 赤伶 是二智呀
  105. 105 有种关系叫知己 刘大壮
  106. 106 怎随天下 王若熙
  107. 107 有人 赵钶
  108. 108 海底 三块木头
  109. 109 有何不可 许嵩
  110. 110 大天蓬 (抖音版) 璐爷
  111. 111 我吹过你吹过的晚风(翻自 ac) 辛辛
  112. 112 只爱西经 林一
  113. 113 关山酒 等什么君(邓寓君)
  114. 114 曾经的你 年少不川
  115. 115 倔强 五月天
  116. 116 Lydia F.I.R.
  117. 117 爱你 王心凌
  118. 118 杀破狼 哥哥妹妹
  119. 119 踏山河 七叔-叶泽浩
  120. 120 错过的情人 雷婷
  121. 121 你看到的我 黄勇/任书怀
  122. 122 新欢渡旧爱 黄静美
  123. 123 慕容晓晓-黄梅戏(南柯一梦 / 明洋 remix) 南柯一梦/MINGYANG
  124. 124 浮白 花粥/王胜娚
  125. 125 叹郁孤 霄磊
  126. 126 贝加尔湖畔 (Live) 李健
  127. 127 不虞 王玖
  128. 128 麻雀 李荣浩
  129. 129 一场雨落下来要用多久 鹿先森乐队
  130. 130 野狼disco 宝石Gem
  131. 131 我们不该这样的 张赫煊
  132. 132 海底 一支榴莲
  133. 133 爱情错觉 王娅
  134. 134 你一定要幸福 何洁
  135. 135 往后余生 马良
  136. 136 放你走 正点
  137. 137 只要平凡 张杰/张碧晨
  138. 138 只要平凡-小石头和孩子们 小石头和孩子们
  139. 139 红色高跟鞋 (Live) 韩雪/刘敏涛/万茜
  140. 140 明月天涯 五音Jw
  141. 141 华年 鹿先森乐队
  142. 142 分飞 徐怀钰
  143. 143 你是我撞的南墙 刘楚阳
  144. 144 同簪 小时姑娘/HITA
  145. 145 我的将军啊-唯美独特女版 熙宝(陆迦卉)
  146. 146 我的将军啊(女版戏腔) Mukyo木西
  147. 147 口是心非 南柯nanklo/乐小桃
  148. 148 DAY BY DAY (Japanese Ver.) T-ara
  149. 149 我承认我怕黑 雅楠
  150. 150 我要找到你 冯子晨
  151. 151 你的答案 子尧
  152. 152 一剪梅 费玉清
  153. 153 纸船 薛之谦/郁可唯
  154. 154 那女孩对我说 (完整版) Uu
  155. 155 我好像在哪见过你 薛之谦
  156. 156 林中鸟 葛林
  157. 157 渡我不渡她 (正式版) 苏谭谭
  158. 158 红尘来去梦一场 大壮
  159. 159 都说 龙梅子/老猫
  160. 160 산다는 건 (Cheer Up) 洪真英
  161. 161 听说 丛铭君
  162. 162 那个女孩 张泽熙
  163. 163 最近 (正式版) 王小帅
  164. 164 不谓侠 萧忆情Alex
  165. 165 芒种 音阙诗听/赵方婧
  166. 166 恋人心 魏新雨
  167. 167 Trouble Is A Friend Lenka
  168. 168 风筝误 刘珂矣
  169. 169 米津玄師-lemon(Ayasa绚沙 Remix) Ayasa
  170. 170 可不可以 张紫豪
  171. 171 告白の夜 Ayasa
  172. 172 知否知否(翻自 胡夏) 凌之轩/rainbow苒
  173. 173 琵琶行 奇然/沈谧仁
  174. 174 一曲相思 半阳
  175. 175 起风了 吴青峰
  176. 176 胡广生 任素汐
  177. 177 左手指月 古琴版 古琴唐彬/古琴白无瑕
  178. 178 清明上河图 排骨教主
  179. 179 左手指月 萨顶顶
  180. 180 刚刚好 薛之谦
  181. 181 悟空 戴荃
  182. 182 易燃易爆炸 陈粒
  183. 183 漫步人生路 邓丽君
  184. 184 不染 萨顶顶
  185. 185 不染 毛不易
  186. 186 追梦人 凤飞飞
  187. 187 笑傲江湖 刘欢/王菲
  188. 188 沙漠骆驼 展展与罗罗
  189. 189 外滩十八号 男才女貌
  190. 190 你懂得 小沈阳/沈春阳
  191. 191 铁血丹心 罗文/甄妮
  192. 192 温柔乡 陈雅森
  193. 193 似水柔情 王备
  194. 194 我只能爱你 彭青
  195. 195 年轻的战场 张杰
  196. 196 七月七日晴 许慧欣
  197. 197 心爱 金学峰
  198. 198 Something Just Like This (feat. Romy Wave) Anthony Keyrouz/Romy Wave
  199. 199 ブルーバード いきものがかり
  200. 200 舞飞扬 含笑
  201. 201 时间煮雨 郁可唯
  202. 202 英雄一怒为红颜 小壮
  203. 203 天下有情人 周华健/齐豫
  204. 204 白狐 陈瑞
  205. 205 River Flows In You Martin Ermen
  206. 206 相思 毛阿敏
  207. 207 只要有你 那英/孙楠
  208. 208 Croatian Rhapsody Maksim Mrvica
  209. 209 来生缘 刘德华
  210. 210 莫失莫忘 麦振鸿
  211. 211 往后余生 王贰浪
  212. 212 雪见—仙凡之旅 麦振鸿
  213. 213 让泪化作相思雨 南合文斗
  214. 214 追梦人 阿木
  215. 215 真英雄 张卫健
  216. 216 天使的翅膀 安琥
  217. 217 生生世世爱 吴雨霏
  218. 218 爱我就跟我走 王鹤铮
  219. 219 特别的爱给特别的你 伍思凯
  220. 220 杜婧荧/王艺翔
  221. 221 I Am You Kim Taylor
  222. 222 起风了 买辣椒也用券
  223. 223 江湖笑 周华健
  224. 224 半壶纱 刘珂矣
  225. 225 Jar Of Love 曲婉婷
  226. 226 野百合也有春天 孟庭苇
  227. 227 后来 刘若英
  228. 228 不仅仅是喜欢 萧全/孙语赛
  229. 229 Time (Official) MKJ
  230. 230 纸短情长 (完整版) 烟把儿
  231. 231 离人愁 曲肖冰
  232. 232 难念的经 周华健
  233. 233 佛系少女 冯提莫
  234. 234 红昭愿 音阙诗听
  235. 235 BINGBIAN病变 Cubi/多多Aydos
  236. 236 说散就散 袁娅维TIA RAY
  237. 237 慢慢喜欢你 莫文蔚
  238. 238 最美的期待 周笔畅
  239. 239 牵丝戏 银临/Aki阿杰
  240. 240 夜的钢琴曲 K. Williams
沈园外 - 阿YueYue/戾格/小田音乐社
00:00 / 00:00
An audio error has occurred, player will skip forward in 2 seconds.

作词 : 於世同君

作曲 : 爱写歌的小田

编曲 : 卡其漠罗洋

制作人 : 爱写歌的小田

混音 : 张鸣利

和声 : 李沅芷

和声编写 : 爱写歌的小田

出品 : 小田音乐社/飞行计划

监制 : 张鹏闻

宣发统筹 : 小小晞

上次落下

要送给你的花

生根让满园都发芽

不见不散吗

这道墙后谁笑了

让我结疤让我落地风化

能释然吧

哪怕拱手送走她

推开门重逢 再相拥吗

约好的山盟 总是入梦

思念难作假

又留在心底 太嘲哳

在池台的正中

像当初的怀中

隔太多春秋会不能相拥

还没到开满花

却看见天边一点点变红

还以为无影踪

记忆里又翻涌

人长大后 太难学从容

总有事忙怎么像化蝶 那么勇

能释然吧

哪怕拱手送走她

推开门重逢 再相拥吗

约好的山盟 总是入梦

思念难作假

又留在心底 太嘲哳

在池台的正中

像当初的怀中

隔太多春秋会不能相拥

还没到开满花

却看见天边一点点变红

还以为无影踪

记忆里又翻涌

人长大后 太难学从容

总有事忙怎么像化蝶 那么勇

在池台的正中

像当初的怀中

隔太多春秋会不能相拥

还没到开满花

却看见天边一点点变红

还以为无影踪

记忆里又翻涌

人长大后 太难学从容

总有事忙怎么像化蝶 那么勇

总有事忙怎么像化蝶 那么勇

词曲提供:词曲家

营销推广:噼里啪啦Studio

发行:讯飞音乐

未经著作权人书面许可,不得以任何方式(包括翻唱、翻录等)使用

点击右上角即可分享
微信分享提示