Chaos is a ladd|

West11

园龄:11个月粉丝:1关注:1

聚类分析

聚类分为两种:对样品分类,Q型;对变量(指标)分类,R类。

Q型

样品空间的相似度——距离

常见的距离描述方法:

  1. 欧几里得距离:

    MATLAB自带函数计算

d = pdist(x)%每个行向量代表一个坐标
  1. 绝对距离:d(xi,yi)=k=1p|xikxjk|

    d = pdist(x,'cityblock')%也叫曼哈顿距离
    
  2. 闵可夫斯基距离:d(xi,yi)=[k=1p|xikxjk|m]1m

    d = pdist(x,'minkowski',r)%r表示指数
    
  3. 切比雪夫距离:d(xi,xj)=maxakp|xikxjk|

    d = max(abs(xi-xj))
    
  4. 马氏距离d(xi,yi)=(xixj)T1(xixj) 其中1指x和y的协方差矩阵的逆矩阵

    d = pdist(x,mahal)
    
S2=tril(suqareform(d)) %将数据转化为三角阵形式,更直观。

样品相似性度数

  1. 最短距离法: 以两类中距离最近的两点确定
  2. 最长距离法:以两类中距离最远的两点确定
  3. 重心法:以两类的重心确定
  4. 类平均法:以两类的样本点距离的平均确定
  5. 离差平方和法 D=xkG1G2(xkx¯)T(xkx¯)xkG1(xkx¯1)T(xkx¯1)xkG2(xkx¯2)T(xkx¯2)

R型

变量相似性度数

  1. 夹角余弦计算

    空间中两个列向量计算夹角余弦值 rjk=cosαij=t=1nxtixtjt=1nxti2t=1nxtj2

2.相关系数

rjk=i=1n(xix¯)(yiy¯)i=1n(xix¯)2i=1n(yiy¯)2

变量聚类法

  1. 最长距离法 : djk2=1rjk2 , 取最大djk
  2. 最短距离法 : 同理,取最小djk.

Q,R型的区别

Q型是样品聚类,得到的参数是各个样品(向量)间的

R是变量聚类,得到的参数是各个元素(指标)间的

详见《数学建模算法与应用》第二版

P226

例题10.1.3

matlab函数

Y = linkage(X,'method')%以不同的方法生成聚类树,默认最短距离

T = cluster(Y,'maxclust',r)%创建聚类, 将对象分为r类

本文作者:West11

本文链接:https://www.cnblogs.com/cxy1114blog/p/18459138

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   West11  阅读(8)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
收起