k-means简介

在不带标签的多维数据集中寻找确定数量的簇。
最优的聚类结果需要符合以下俩个假设：

簇中心点 cluster center 是属于该簇的所有数据点坐标的算术平均值
一个簇的每个点到该簇中心点的距离比到其他簇中心点的距离短。

原始数据，包含4个明显的簇

评估器拟合数据：

高斯混合模型

k-means的非概率性和它仅根据到簇中心点的距离来指派簇的特点将导致性能底下。
高斯混合模型被看作是k-means思想的一个扩展。也是一种非常强大的聚类评估工具。
可以通过比较每个点与所有簇中心点的距离来度量簇分配的不确定性。而不仅仅是关注最近的簇。
通过将簇的边界由圆形放宽值椭圆型，从而得到非圆形的簇。

posted on 2022-06-08 21:36 llcl 阅读(246) 评论(0) 收藏举报

刷新页面返回顶部


博客园 © 2004-2026 浙公网安备 33010602011771号浙ICP备2021040463号-3

导航

k-means简介

高斯混合模型