正则表达式中的split的使用
正则表达式中的split的使用
# 正则表达式中的split的使用
import re
pattern = r',|\.|/|;|\'|`|\[|\]|<|>|\?|:|"|\{|\}|\~|!|@|#|\$|%|\^|&|\(|\)|-|=|\_|\+|,|。|、|;|‘|’|【|】|·|!| |…|(|)'
test_text = "近日,国新办举行国务院政策例行吹风会,介绍{“十四五”职业技能培训规划}有关情况。人力资源和社会保障部表示,我国正在为技能人才探索建立“新八级”职业技能等级制度,即由低到高,在学徒工、初级工、中级工、高级工、技师、高级技师、特级技师的基础上,再增设首席技师。"
result_list = re.split(pattern, test_text, maxsplit=1)
print(result_list) #按照标点符号切分,并消除标点符号
# re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功,则返回一个列表,否则返回原string列表;
# 第一个参数:正则表达式
# 第二个参数:要匹配查找的原始字符串;
# 第三个参数:可选参数,表示最大的拆分次数,默认为0,表示全部分割;
# 第四个参数:可选参数,标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等
记录学习的点点滴滴