摘要: (利用grep进行文本处理) 背景 需要将一份百万的数据按照一定的规格(开头以地市字符)进行数据拆分。 相关命令 grep wc 思路 根据grep的正则匹配出以hz、nb开头的数据 过程 1.首先用grep过滤出数据 grep '^hu' aaa.txt >hu.txt grep '^hz' aa 阅读全文
posted @ 2022-04-15 18:30 emiya丶zero 阅读(76) 评论(0) 推荐(0)
摘要: 背景 有个需求需要将数据库的字符串后面一到四位的文本去掉文本格式是(-1到-999),因此想到使用正则表达式取出来这批语句,因为不是固定长度因此选用动态获取长度去replace数据。 因为采用的是异构数据库,因此下面提供了oracle和pgsql的逻辑 步骤一:根据正则取目标值 oracle reg 阅读全文
posted @ 2022-04-08 18:55 emiya丶zero 阅读(345) 评论(0) 推荐(0)
摘要: 背景 原因很简单,当初工程拆分,把老代码的gbk文件原封不动的挪到了新的工程,gradle编译已经指定了options.encoding = "UTF-8" 但是还是会出现gbk乱码导致编译不成功。只怪自己太菜不会用gradle解决,只能退而求其次用shell脚本进行gbk转utf-8. 代码 在# 阅读全文
posted @ 2022-03-21 19:17 emiya丶zero 阅读(214) 评论(0) 推荐(0)