python 用正则表达式去除特殊字符的两种方法

python 用正则表达式去除特殊字符的两种方法

 



s = '*\/:?"<>|' #这9个字符在Windows系统下是不可以出现在文件名中的
str1 = '\巴拉<1"!11【】>1*hgn/p:?|' #样例

  



1.提取感兴趣(想要)的字符

a = re.findall('[\u4e00-\u9fa5a-zA-Z0-9]+',str1,re.S) #只要字符串中的中文,字母,数字
a = "".join(a)
print(a)

 

结果如下:

巴拉1111hgnp

 

2.只去除不想要的,比如只去除不能作为文件名的字符

a = re.findall(r'[^\*"/:?\\|<>]',str1,re.S) 
a = "".join(a)
print(a)

结果如下:  

巴拉1!11【】1hgnp

  

 

posted @ 2020-06-13 23:09  JIMfan  阅读(12085)  评论(0编辑  收藏  举报