会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
醉 曦
心迷则此岸,心悟则彼岸!
博客园
首页
新随笔
联系
订阅
管理
2018年9月7日
Kmeans文档聚类算法实现之python
摘要: 实现文档聚类的总体思想: 将已经分好词的文档提取关键词,统计词频: 上面的count函数统计的一篇文档的词频,如果每篇文档都需要统计则需要调用这个count函数,每调用一次就返回一个dict,给一个文档集统计词频的参考代码如下(假设有500篇文档): 上面两部分可以实现将文档集里的关键词,担心是否正
阅读全文
posted @ 2018-09-07 13:32 醉曦
阅读(3492)
评论(0)
推荐(1)
编辑