python 用正则表达式去除特殊字符的两种方法
python 用正则表达式去除特殊字符的两种方法
s = '*\/:?"<>|' #这9个字符在Windows系统下是不可以出现在文件名中的 str1 = '\巴拉<1"!11【】>1*hgn/p:?|' #样例
1.提取感兴趣(想要)的字符
a = re.findall('[\u4e00-\u9fa5a-zA-Z0-9]+',str1,re.S) #只要字符串中的中文,字母,数字 a = "".join(a) print(a)
结果如下:
巴拉1111hgnp
2.只去除不想要的,比如只去除不能作为文件名的字符
a = re.findall(r'[^\*"/:?\\|<>]',str1,re.S) a = "".join(a) print(a)
结果如下:
巴拉1!11【】1hgnp