机器学习的几个问题探讨

只有正样本的分类问题(Learning from Positive and Unlabeled examples)

对于一个分类问题,有时候训练样本只有正样本,没有负样本。比如,文本分类中,假设我们有一些标定好的训练样本,有n个类,我们用这些训练样本去训练一个分类器,用于把新的文本分成n类。问题的关键是我们没有负样本,而只有一些未标定正样本与负样本的训练数据。这样的问题叫做PU学习。
待续。。。

参考文献:
Bing Liu

训练样本中一些数据标记有错误

一些训练样本的一些特征缺失,依据这些缺失特征的训练样本构建分类器

posted @ 2016-06-13 22:47  goodluckcwl  阅读(110)  评论(0编辑  收藏  举报