用python的re(正则表达式)模块匹配英文环境下的括号

在用re(正则表达式)模块匹配掉文本中的括号时，总是出现各种各样的问题，经过将近一个小时的摸索，终于找到了问题的所在。

案例：

将 txt = 'Linux系统安装 - 1.1(Av20994127,P1).Flv' 中的(Av20994127,P1)匹配出来，再用re.sub()去掉。

初次尝试：

import re

txt = 'Linux系统安装 - 1.1(Av20994127,P1).Flv' 

tx = re.search('.*?(\(.*?\)).Flv', txt)

re.sub(tx.group(1), '', txt) 
Out[1]: 'Linux系统安装 - 1.1().Flv' # 括号()仍在，无法去掉。

解决方案：

import re

tx = re.search('.*?(\(.*?\)).Flv', txt)

re.sub('\('+tx.group(1)+'\)', '', txt)        # 在tx.group(1) 前后分别加上 '\(' 与 '\)‘
                                              # 由于才疏学浅，具体原理不明，如有高人路过，还望解答。
Out[2]: 'Linux系统安装 - 1.1.Flv'    # 括号()被去掉。

进阶：

当文本中只有一个括号(单括号)时，即：text = 'Linux系统安装 - 1.1(Av20994127,P.Flv'

用相同的方法，出现 error: missing ), unterminated subpattern 的错误。

经摸索发现，解决方案如下：

import re

text = 'Linux系统安装 - 1.1(Av20994127,P.Flv'

result = re.search('.*?(\(.*?,P),Flv', text)

new = re.sub('\\' + result.group(1), '', text) # 在result.group(1)前面加 ’\\‘

Out[3]: 'Linux系统安装 - 1.1.Flv'

posted @ 2018-09-23 21:51 bp9jISKIN 阅读(16571) 评论(0) 收藏举报

刷新页面返回顶部

bp9jISKIN

用python的re(正则表达式)模块匹配英文环境下的括号

公告