ZeroR-baseline分类器

ZeroR分类器是一种最简单的分类器,这种方法仅仅根据历史数据统计规律,而选择一种概率最大的类别作为未知样本的分类结果,也就是说对于任意一个未知样本,分类结果都是一样的。ZeroR分类器简单的以多数类的类别(连续型数据使用简单均值)作为预测值。尽管这种分类器没有任何的预测能力,但是它可以作为一种与其他分类器的对比分类器。也就是说baseline performance。

算法描述:

为数据集建立一个频度表来选择一个频率最大的值。

例子:

模型:对于下面的数据集来说“Play Golf =Yes” 是ZeroR模型,精度为:0.64

预测性能:属性值也就是上面的预测指标(predictors)对于模型来说毫无贡献度。这是因为ZeroR根本就没有使用它们。

模型度量(Model Evaluation)


Confusion Matrix:

       yes    no

yes   9        0

no     5       0

所以预测精度为:0.64

posted @ 2014-03-28 10:55  愚人_同乐  阅读(3621)  评论(0编辑  收藏  举报