会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
xiao晓
serendipity
博客园
首页
新随笔
联系
订阅
管理
2010年10月26日
文本分类中样本的筛选(基于VSM模型)
摘要: 1、选筛选的人对分类的结构、每个分类中应该有哪些文章应该比较清楚并有一定的理解。2、择较容易判别、典型的文章:一篇文章大致阅读以后,就能判定这篇文章属于哪个类别,而且可以指出因为哪些词语而使得这篇文章归属到该类别,这样的样本为上佳样本。3、感觉这篇文章会在类别中有交叉,则立即放弃 。4、对于分类中可能出现的文章内容,每个都筛选一些样本 。反例:关于时事新闻的类别可能包含的内容:国际时事、近期的国际...
阅读全文
posted @ 2010-10-26 23:37 xiao晓
阅读(359)
评论(0)
推荐(1)
编辑
公告