摘要: 实现文档聚类的总体思想: 将已经分好词的文档提取关键词,统计词频: 上面的count函数统计的一篇文档的词频,如果每篇文档都需要统计则需要调用这个count函数,每调用一次就返回一个dict,给一个文档集统计词频的参考代码如下(假设有500篇文档): 上面两部分可以实现将文档集里的关键词,担心是否正 阅读全文
posted @ 2018-09-07 13:32 醉曦 阅读(3492) 评论(0) 推荐(1) 编辑