2010年12月9日

K-MEANS算法的C++实现

摘要: #include <stdio.h>#include <stdlib.h>#include <math.h>#define NA 4 /* 数据维数 */#define K 3 /* 聚类数 */#define Psize 50 /* 种群大小 */#define T 30 /* 最大迭代数 */#define ED 0.0000001 /* 结束条件 */typedef struct { double p[NA]; double distance[K];}Point;typedef struct { Point clu_cent[K]; /* 即clust 阅读全文

posted @ 2010-12-09 11:30 karying 阅读(1077) 评论(0) 推荐(1) 编辑

K-means 简介

摘要: Kmeans算法 k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。编辑本段算法流程 首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类 阅读全文

posted @ 2010-12-09 10:45 karying 阅读(285) 评论(0) 推荐(0) 编辑

K-means clustering 介绍论文

摘要: 论文:基于距离的划分聚簇算法[分享]叶若芬李春平 (清华大学软件学院北京100084)摘要:k-means算法在聚簇大的数据集时是公认比较有效的算法之一,然而它只能应用在具有数值属性描述的数据对象集合上,这种数据对象叫做数值数据;却无法应用于真实世界中具有其他形形色色属性的数据对象集合上,比如颜色、纹理、形状等特征描述的数据对象集合,这种数据叫做分类数据。为了能对分类数据进行聚簇,对k-means算法进行了扩展,出现两种新的算法:一种是k-modes算法,另一种是k-prototypes算法。但这两种算法都需要用户事先确定聚簇数k、阈值t和聚簇中心Q,在不明白数据分布状况的情况下能较准确地确定 阅读全文

posted @ 2010-12-09 10:36 karying 阅读(979) 评论(0) 推荐(0) 编辑

导航