代码改变世界

模式识别学习笔记[1]——基于试探的聚类搜索算法

2010-12-25 21:14  smyb000  阅读(886)  评论(0编辑  收藏  举报

一.按最邻近规则的简单试探法。

假设有N个样本{X1,X2...Xn}

步骤1:

      将第一个样本作为第一类的中心,Z1=X1.

步骤2:

      将剩下的样本计算||Xi-Z1 ||,若大于阈值T,则Xi作为新的一类的中心Z2.

步骤3:

      将剩余样本分别计算||Xi-Z1||,||Xi-Z2||,若||Xi-Z1||>T且||Xi-Z2||>T,则取Xi作为新的聚类的中心Z3。

      否则Xi属于距离Z1和Z2的较近者。

步骤4:

      按上述策略重复下去,直至将N个模式分类完毕。

 

二.最大最小距离聚类。

 

步骤1:

      将第一个样本X1作为第一类的中心Z1.

步骤2:

      在剩余样本中选出距离X1最远的样本Xi作为第二类的中心Z2.

步骤3:

      计算剩余样本Xi距离Z1,Z2的较小者min(||Xi-Z1||,||Xi-Z2||),并取这些距离的最大值max。若max>C*||Z1-Z2||,则Xi为Z3.C为常量.若找不到,则聚类结束。若找到,则按上述规则继续找新的类。

步骤4:

    找到各类及其中心点后,剩余样本分配到最邻近的类。

Singles Web Site Houston