摘要: 1、要预处理xml文件,解决docs,url,content标签问题。主要代码是deal_label.py 存入数据文件夹是sougou_label_after SogouCS.reduced:存放原始的txt; sougou_label_after:解决docs,url,content标签问题 2 阅读全文
posted @ 2019-04-26 17:09 宁小静 阅读(1303) 评论(0) 推荐(0) 编辑