Kappa 统计量

行代表真实类别

列代表预测类别

 

精确率 = 对角线的和 / 总数

p0 = (239 + 73 + 280)  / 664 = 0.891566265060241

 

 基于随机的分类

 

 占比为预测为A\B\C类占总数的比例 

预测为A 类的可能 = 276 / 664 = 0.415663

预测为B 类的可能 = 93 / 664 = 0.14006

预测为C 类的可能 = 295 / 664 = 0.444277

使用这个比例将红色区域填满:

第一行:随机分类器将会把0.415663的人分为A类,261的0.415663为108.488,

    该分类器将会把0.14006的人分为B类,261的0.415663为36.55572

    改分类器会把会有0.444277分为C类,261的0.444277为115.95

以此类推,第二行

随机分类器将会把0.415663的人分为A类,103的0.415663为42.81,

    该分类器将会把0.14006的人分为B类,103的0.415663为14.42

    改分类器会把会有0.444277分为C类,103的0.444277为45.76

 

因此pr = (108.488 + 14.4262 + 133.2831) / 644 = 0.385839290898534

Kappar  k = (p0 - pr) / (1 - pr) = 0.823444037801766

 

如何解释这个结果,下面给出一个帮助我们理解该统计量大小的对照表:

<0: 比随机方法的性能还差(less than chance performance)

0.01-0.20: 轻微一致

0.21-0.40: 一般一致

0.41-0.60:中度一致

0.61-0.80:高度一致

0.81-1.00:接近完美

 

posted on 2018-01-24 14:02  Mrs.Totoro  阅读(984)  评论(0编辑  收藏  举报

导航