会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
fesh1124
在你想要放弃的那一刻,想想为什么当初坚持走到了这里...
导航
博客园
首页
新随笔
联系
订阅
管理
公告
2014年6月8日
Mahout源码分析之 -- 文档向量化TF-IDF
摘要: fesh个人实践,欢迎经验交流!Blog地址:http://www.cnblogs.com/fesh/p/3775429.html Mahout之SparseVectorsFromSequenceFiles源码分析一、原理TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一...
阅读全文
posted @ 2014-06-08 00:34 feshy
阅读(2049)
评论(0)
推荐(0)
编辑