regex-tuesday,每周二会出一道正则表达式的题目,本周的题目很有难度,如果你答出来了,可以留言,如果答不出来.可以看看我的答案和解释.下面内嵌了原题目页面.你要做的就是使用JavaScript正则字面量的写法/regex/i,来通过所有的测试用例.
查看答案
这个题目看似是要把一些由各种字符分割的字符串替换成逗号分割的csv文件格式.
根据前两个用例,最先想到的正则是:
第3个用例没有匹配,这也是本题最难的地方了,要确保把引号包围的字符串看成一个整体,不替换其中的空格,没有什么好的办法,只能使用一个|分支,在添加逗号的同时还得把两边的引号去掉:
/ "(.+?)"| /g 替换为 ,$1 //匹配情况10/17
第4个用例里面还有单引号:
/ ["'](.+?)["']| /g 替换为 ,$1 //匹配情况11/17
第8个用例中,分隔符不再只有空格了,还有双连字符:
/ ["'](.+?)["']| |--+/g 替换为 ,$1 //匹配情况14/17
倒数第2个和第3个用例中又多了;分割符,和空格放在一起:
/ ["'](.+?)["']|[ ;]+|--+/g 替换为 ,$1 //匹配情况16/17
倒数第5个用例中又多了,分割符,但没什么好办法处理,因为其他的字段中也有逗号,比如can't,只能用笨办法列举出来:
/ ["'](.+?)["']| '|' |[ ;]+|--+/g 替换为 ,$1 //匹配情况17/17
我写的实在不怎么好,有一位国外的同志想了个很巧妙的解法:
/\s("|')(.*?)\1|\W?\s\W?|-{2,}/g 替换为 ,$2 //匹配情况17/17