随笔分类 - Regex
摘要:1.将 city_code_cn.json 中的省、市、区,翻译成英文,或直接替换去掉省、市 如:苏州市 -> 苏州 转成拼音后就变成 Suzhou,否则就会转成 Suzhoushi 怪怪的 import pypinyin import re def pinyin(word): s = '' for
阅读全文
摘要:效果如图: JAVA 代码 public static void main(String[] args) throws Exception { String str = "<row PTID=\"80268175\" ZYH=\"2002868\" XM=\"刘云1\" YZLB=\"0\" YSX
阅读全文
摘要:8ml*20片/盒、100mg*12粒/盒, 一看就能看出 1盒 = 20 片、1盒=12粒 可以用正则提取出想要的数据: 转换系数(20) : \d+(?=[\u4E00-\u9FA5]/) 拆零单位(片) : [\u4E00-\u9FA5](?=/) 最小包装单位(盒): (?<=/)[\u4E
阅读全文
摘要:一般来说一个 HTML 文档有很多标签,比如“<html>”、“<body>”、“<table>”等,想把文档中的 img 标签提取出来并不是一件容易的事。由于 img 标签样式变化多端,使提取的时候用程序寻找并不容易。于是想要寻找它们就必须写一个非常健全的正则表达式,不然有可能会找得不全,或者找出
阅读全文