222wan

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

pandas提取字符(数据清洗)

python正则表达式匹配专利号 - 掘金 (juejin.cn)

 

pandas 给某一列添加字符串或者添加新的列 - 半日闲1 - 博客园 (cnblogs.com)

 

正则表达式齐全:

pandas正则表达式,提取汉字、字母、数字、罗马数字_pandas正则表达式提取数字-CSDN博客

https://www.cnblogs.com/BluceLee/p/11419302.html

 如何在 Pandas 中使用正则表达式 - 知乎 (zhihu.com)

 

df['专利号']=df['专利号'].str.strip()#去除空格

def clear_character(text):
    return re.sub('(;.{5})','',text)#(;.{5})表示分号后面的5个内容 点表示所有个内容
#实际运行下来一个点表示一个,应该是所有类型的内容{5}表示往后5个位置
    #return re.sub('[\u4e00-\u9fa5]','',text)#去除内部的中文
df['专利号']=df['专利号'].apply(clear_character)

 

^符号shizhey

 是这样用的

一些匹配的方法:正则表达式位置匹配——匹配两个特殊符号中间的内容_Java_jerry.mei_InfoQ写作社区

 

posted on   角落的蘑菇  阅读(32)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示