会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
StevenLuke
博客园
首页
新随笔
联系
订阅
管理
2016年7月19日
THUCLC笔记
摘要: THUCLC是清华的一个Java版本的文本分类器。 分类使用的是LibLinear软件包,LibLinear和LibSVM相似,但是前者更擅长大量数据的处理。 用来训练的是一些文本,压缩后大小为3.6GB。 我是想看里面的特征提取,THUCLC的特征是:词 + tfidf。其中tfidf缩放在【...
阅读全文
posted @ 2016-07-19 17:45 StevenLuke
阅读(146)
评论(0)
推荐(0)
编辑
公告