摘要: 一、K均值算法的优化目标 K-均值最小化问题,是要最小化所有的数据点与其所关联的聚类中心点之间的距离之和,因此 K-均值的代价函数(又称畸变函数 Distortion function)为: 其中𝜇𝑐(𝑖)代表与𝑥(𝑖)最近的聚类中心点。 我们的的优化目标便是找出使得代价函数最小的 𝑐( 阅读全文
posted @ 2019-03-11 19:23 chalee3 阅读(1057) 评论(0) 推荐(0) 编辑
摘要: K-均值是最普及的聚类算法,算法接受一个未标记的数据集,然后将数据聚类成不同的组。 K-均值是一个迭代算法,假设我们想要将数据聚类成n 个组,其方法为: 首先选择𝐾个随机的点,称为聚类中心(cluster centroids); 对于数据集中的每一个数据,按照距离𝐾个中心点的距离,将其与距离最近 阅读全文
posted @ 2019-03-11 07:04 chalee3 阅读(545) 评论(0) 推荐(0) 编辑