摘要: 优点:容易实现。 缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢。 适用数据类型:数值型数据。 k均值是发现给定数据集的k个簇的算法。簇个数k是用户给定的,每一个簇通过其质心(centroid),即簇中所有点的中心来描述。 工作流程:首先,随机确定k个初始点作为质心。然后将数据集中的每个点分配 阅读全文
posted @ 2016-05-27 11:14 woaielf 阅读(398) 评论(0) 推荐(0) 编辑