贫民窟里的程序高手

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

今天遇到了一个不规则的csv文件,需要格式化一下,用到了notepad++里的正则表达式查找,在这里浅记一下:

首先,将所有行的行首加入,,  用来增加两个空列: 

 

然后,查找出初始就有三列的行,内容大体格式如下  XXX,XXX,XXX 

这里的难度是需要匹配出一整行的字符串,且字符串的规律是中间有俩逗号,我用的正则表达式如下:

 

 

其中^是代表行首,$代表行位,中间的括号是用来提取正则表达式匹配的文本内容,用以替换的时候使用。

我替换的时候是这么用的:

 

其中,()里的内容表示要提取的,\1 或者$1表示目标中第一个圆括号匹配的内容。该方法特别适合处理大量数据,包括文件名,数字字母混杂数据等。

这样就将原有的三列行开头加入了标识符@@

然后替换@@,, 为  空字符串  就可以了。

 

posted on 2022-08-10 15:01  贫民窟里的程序高手  阅读(1052)  评论(0编辑  收藏  举报