为啥一样一样的正则表达式,去提取就提取不出来?

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群【哎呦喂  是豆子~】问了一个Pandas数据提取的问题。问题如下图所示:

大佬们    为啥一样一样的正则表达式  for循环就可以出结果 用apply(lambda x:re.findall(pattern,x)) 去提取就提取不出来?

图一:

image.png

图二:

image.png

二、实现过程

这里【隔壁😼山楂】给了一个指导,如下所示:图一前面没有r,图二你这里有r。

image.png

这个方法顺利地解决了粉丝的问题。

没有'r'反斜杠是转义字符   有'r'反斜杠不是转义字符  一般的可以使用\\双斜杠去匹配。

如果你也有类似这种数据分析的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Pandas数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【哎呦喂  是豆子~】提出的问题,感谢、【隔壁😼山楂】、【瑜亮老师】、【添砖java】给出的思路,感谢【莫生气】、【冯诚】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

image.png

posted @ 2024-01-29 21:54  dcpeng  阅读(13)  评论(0编辑  收藏  举报