聚类评估:轮廓系数

计算样本到同簇其他样本的平均距离ai, ai越小,说明样本越应该被聚类到该簇

计算样本到其他簇样本的平均距离bi,这个称为样本与簇Cj的不相似度

s(i) = (b(i) - a(i)) / max(b(i), a(i))

si 接近1, 说明b(i) 远大于a(i), 说明分类的越合理

si接近0, 说明b(i) == a(i), 即样本分布在分类边界的边缘

si等于-1,说明分类越不合理

 

posted on 2019-01-21 11:25  python我的最爱  阅读(876)  评论(0编辑  收藏  举报