会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
xiao dan feng
博客园
首页
新随笔
联系
订阅
管理
2014年10月23日
基于KNN的newsgroup 18828文本分类器的Python实现
摘要: 还是同前一篇作为学习入门。1. KNN算法描述:step1: 文本向量化表示,计算特征词的TF-IDF值step2: 新文本到达后,根据特征词确定文本的向量step3 : 在训练文本集中选出与新文本向量最相近的k个文本向量,相似度度量采用“余弦相似度”,根据实验测试的结果调整k值,此次选择20ste...
阅读全文
posted @ 2014-10-23 10:48 xiao dan feng
阅读(3109)
评论(4)
推荐(0)
编辑
公告