会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
炼己者
NLP公众号:ZhangyhPico
博客园
首页
新随笔
联系
管理
2018年9月23日
用半监督算法做文本分类(自训练)
摘要: 本文主要讲述的是基于自训练的半监督学习算法做文本分类,自训练算法是半监督学习中比较常见的方法之一,但是自训练方法有一个很大的问题,在迭代过程中,如果初始训练样本集中已标注样本的数量过少,则可能会出现错误标注,并通过迭代使错误逐渐被放大,最终导致错误累积。所以我们采用对未标注样本重复标记策略来优化自训练算法。
阅读全文
posted @ 2018-09-23 14:41 炼己者
阅读(7719)
评论(5)
推荐(2)
编辑
公告