假设有两类样本,A类和B类,我们要衡量分类器分类A的能力。
现在将所有样本输入分类器,分类器从中返回了一堆它认为属于A类的样本。
召回率:分类器认为属于A类的样本里,真正是A类的样本数,占样本集中所有真正A类样本的比例。也就是说,如果分类器认为所有样本都属于A类,那么它的召回率一定是100%,因为它认为的A类样本里一定包含了所有真正的A类样本。
精确率:分类器认为属于A类的样本里,真正的A类样本占它认为是A的样本数的比例。也就是说,如果分类器觉得所有样本里就1个属于A类,那么如果这个样本真的属于A类,分类器的精确率就是100%。但是也容易注意到,这样的话分类器的召回率可能会非常低,因为在样本集中所有A类样本中,它至多能认出来1个。