摘要: 对前文 https://www.cnblogs.com/cycxtz/p/13378922.html 思路1进行补充。 可以考虑jieba分词库,不过需要先进行训练。 依赖库:jieba 提前准备:国家统计局所有地区信息,以及地区简写。 下来,对使用jieba分词库的add_word。参考使用网站: 阅读全文
posted @ 2020-07-26 19:58 forxtz 阅读(1045) 评论(0) 推荐(0) 编辑
摘要: 需求:由于业务检查需求,需要将一个结构化地址,如”XX省XX市XX区XXX号“地区转化为对应国家统计区行政划分的 省、市、区(县)、镇(街道)、乡结构。 解决思路: 1、自行编制文本解析方法,考虑比较复杂,很多情况不能覆盖,暂时不考虑,如果能解析,则速度会比较快。 2、通过爬虫,在百度搜索“百度百科 阅读全文
posted @ 2020-07-26 12:19 forxtz 阅读(2188) 评论(4) 推荐(0) 编辑