pandas提取字符(数据清洗)
python正则表达式匹配专利号 - 掘金 (juejin.cn)
pandas 给某一列添加字符串或者添加新的列 - 半日闲1 - 博客园 (cnblogs.com)
正则表达式齐全:
pandas正则表达式,提取汉字、字母、数字、罗马数字_pandas正则表达式提取数字-CSDN博客
https://www.cnblogs.com/BluceLee/p/11419302.html
如何在 Pandas 中使用正则表达式 - 知乎 (zhihu.com)
df['专利号']=df['专利号'].str.strip()#去除空格 def clear_character(text): return re.sub('(;.{5})','',text)#(;.{5})表示分号后面的5个内容 点表示所有个内容 #实际运行下来一个点表示一个,应该是所有类型的内容{5}表示往后5个位置 #return re.sub('[\u4e00-\u9fa5]','',text)#去除内部的中文 df['专利号']=df['专利号'].apply(clear_character)
^符号shizhey
是这样用的
一些匹配的方法:正则表达式位置匹配——匹配两个特殊符号中间的内容_Java_jerry.mei_InfoQ写作社区