摘要: preface 这一篇我们做文本相似度计算主要采用jieba,Gensim模块来做。文本相似度有什么用呢?它能够计算出文本内容相似的文章,可以把相似的文章推送给读者,也可以去计算几篇文章是否存在抄袭的嫌疑。好那么下面就开始开车,请坐稳扶好。 windows下大型文本读取如何处理字符编码问题: 我们首 阅读全文
posted @ 2017-01-15 16:24 温柔易淡 阅读(14560) 评论(0) 推荐(1) 编辑