匹配汉字或者数字 正则

strinfo=re.compile(r'([\u4e00-\u9fa5]|[\d])')
df['label']=df['data'].apply(lambda x:strinfo.sub('',x))


strip_=re.compile(r'([,]|[。]|[:]|[、])')
括号里面的符号不需要再加引号了


 

posted @ 2019-09-04 12:12  交流_QQ_2240410488  阅读(617)  评论(0编辑  收藏  举报