222wan

导航

pandas提取字符(数据清洗)

python正则表达式匹配专利号 - 掘金 (juejin.cn)

 

pandas 给某一列添加字符串或者添加新的列 - 半日闲1 - 博客园 (cnblogs.com)

 

正则表达式齐全:

pandas正则表达式,提取汉字、字母、数字、罗马数字_pandas正则表达式提取数字-CSDN博客

https://www.cnblogs.com/BluceLee/p/11419302.html

 如何在 Pandas 中使用正则表达式 - 知乎 (zhihu.com)

 

df['专利号']=df['专利号'].str.strip()#去除空格

def clear_character(text):
    return re.sub('(;.{5})','',text)#(;.{5})表示分号后面的5个内容 点表示所有个内容
#实际运行下来一个点表示一个,应该是所有类型的内容{5}表示往后5个位置
    #return re.sub('[\u4e00-\u9fa5]','',text)#去除内部的中文
df['专利号']=df['专利号'].apply(clear_character)

 

^符号shizhey

 是这样用的

一些匹配的方法:正则表达式位置匹配——匹配两个特殊符号中间的内容_Java_jerry.mei_InfoQ写作社区

 

posted on 2024-03-12 10:49  角落的蘑菇  阅读(22)  评论(0编辑  收藏  举报