会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
waemz
my
博客园
首页
新随笔
联系
订阅
管理
2009年5月29日
文本分类(二)特征权重量化器(文档转向量表示)
摘要: 上一节做了分词器的实现,并实现了Simple、Standar、Cn、ICTCLAS几个分词算法。本节实现文档转向量表示,并命名为特征权重量化器,特征权重量化我只实现1个算法----TFIDF算法。
阅读全文
posted @ 2009-05-29 21:45 waemz
阅读(763)
评论(0)
推荐(0)
编辑
文本分类(一)封装分词器
摘要: 我自己简易封装了一个分词器,使用Lucene.Net.类图如下
阅读全文
posted @ 2009-05-29 18:14 waemz
阅读(557)
评论(1)
推荐(0)
编辑
公告