摘要:
调试工具 1 pdb 自然语言处理 1.jieba:中文分词,支持三种分词模式(精确模式、全模式、搜索引擎模式),支持繁体分词,支持自定义词典等,是目前一个非常不错的Python中文分词解决方案。 Github主页:https://github.com/fxsjy/jieba 2.gensim:主题 阅读全文
摘要:
报错:SyntaxError:Non-UTF-8 code starting with '\x..' in file ... 1 #获得没法识别的字节错误:"Incorrect string value:'\\xF0\\xAB\\x96\\xAF\\xE7\\x9A...',把字节错误的地方换成? 阅读全文