摘要:
对前文 https://www.cnblogs.com/cycxtz/p/13378922.html 思路1进行补充。 可以考虑jieba分词库,不过需要先进行训练。 依赖库:jieba 提前准备:国家统计局所有地区信息,以及地区简写。 下来,对使用jieba分词库的add_word。参考使用网站: 阅读全文
摘要:
需求:由于业务检查需求,需要将一个结构化地址,如”XX省XX市XX区XXX号“地区转化为对应国家统计区行政划分的 省、市、区(县)、镇(街道)、乡结构。 解决思路: 1、自行编制文本解析方法,考虑比较复杂,很多情况不能覆盖,暂时不考虑,如果能解析,则速度会比较快。 2、通过爬虫,在百度搜索“百度百科 阅读全文