正则表达式做批量替换思考与学习
一直在做一些很基础脑残的手工性工作,例如:将一大批的网址整理成json的格式,或者将很多的word文档中表格数据整理成为json数据,或者python中的dict类型,以前只是傻乎乎的粘贴复制,有时候也就是将已存在的字符批量替换一下,最近对正则表达式有了简单的学习,感觉可以用正则表达式进行必要的替换。
一、整理word文档中错误码提示
总共260多个,先复制到编辑器(以pycharm为例)
Ctrl + R 替换,选中Regex
6101-->请求数据缺少必选项 将-->替换为": "
然后给数字前边批量添加" ,正则表达式:(\d{4}),替换为"$1 结果:"6101": "请求数据缺少必选项
然后替换后边的文字为:请求数据缺少必选项" 即可
正怎表达式:([^"|:|\d|\s]\W{5,}),替换为 $1",结果:"6101": "请求数据缺少必选项",
二、在word中的替换
1、段落标记 ^p
2、制表符 ^t
3、任意字符 ^?
4、任意数字 ^#
5、任意字母 ^$
6、脱字号 ^^
7、分节符 ^%
8、段落符号 ^v
9、分栏符 ^n
10、省略号 ^i
11、全角省略号 ^j
12、长划线 ^+
13、1/4长划线 ^q
14、短划线 ^=
15、无宽可选分隔符 ^x
16、无宽非分隔符 ^z
17、尾注标记 ^e
18、域 ^d
19、脚注标记 ^f
20、图形 ^g
21、手动换行符 ^1
22、手动分页符 ^m
23、不间断连字符 ^~
24、不间断空格 ^s
25、可选连字符 ^-
26、分节符 ^b
27、空白区域 ^w
★请将光标置于“编辑/查找/查找内容”框中,点选“高级/特殊字符”内各项,对上列字符予以核对。
--------------------