摘要: 在window下使用gemsim.models.word2vec.LineSentence加载中文维基百科语料库(已分词)时报如下错误: 这种编码问题真的很让人头疼,这种问题都是出现在xxx.decode("utf-8")的时候,所以接下来我们来看看gensim中的源码: 从源码中可以看到__ite 阅读全文
posted @ 2019-02-21 12:02 微笑sun 阅读(9399) 评论(0) 推荐(0) 编辑