摘要: 调试工具 1 pdb 自然语言处理 1.jieba:中文分词,支持三种分词模式(精确模式、全模式、搜索引擎模式),支持繁体分词,支持自定义词典等,是目前一个非常不错的Python中文分词解决方案。 Github主页:https://github.com/fxsjy/jieba 2.gensim:主题 阅读全文
posted @ 2019-09-19 15:00 糖醋排骨加辣椒 阅读(158) 评论(0) 推荐(0) 编辑
摘要: 报错:SyntaxError:Non-UTF-8 code starting with '\x..' in file ... 1 #获得没法识别的字节错误:"Incorrect string value:'\\xF0\\xAB\\x96\\xAF\\xE7\\x9A...',把字节错误的地方换成? 阅读全文
posted @ 2019-09-19 10:18 糖醋排骨加辣椒 阅读(564) 评论(0) 推荐(0) 编辑