今天遇到了一个不规则的csv文件,需要格式化一下,用到了notepad++里的正则表达式查找,在这里浅记一下:
首先,将所有行的行首加入,, 用来增加两个空列:
然后,查找出初始就有三列的行,内容大体格式如下 XXX,XXX,XXX
这里的难度是需要匹配出一整行的字符串,且字符串的规律是中间有俩逗号,我用的正则表达式如下:
其中^是代表行首,$代表行位,中间的括号是用来提取正则表达式匹配的文本内容,用以替换的时候使用。
我替换的时候是这么用的:
其中,()
里的内容表示要提取的,\1
或者$1
表示目标中第一个圆括号匹配的内容。该方法特别适合处理大量数据,包括文件名,数字字母混杂数据等。
这样就将原有的三列行开头加入了标识符@@
然后替换@@,, 为 空字符串 就可以了。