摘要:
在学习谱聚类算法之前,首先复习一下:实对称阵的特征值是实数 实对称阵不同特征值的特征向量正交 令实对称矩阵为A,其两个不同的特征值λ1λ2对应的特征向量分别是μ1μ2; λ1λ2 μ1μ2都是实数或是实向量。 正式介绍谱聚类 谱和谱聚类 方阵作为线性算子,它的所有特征值的全体统称方阵的谱。 方阵的 阅读全文
摘要:
密度聚类方法:1.DBSCAN 2.密度最大值算法 密度聚类方法的指导思想是,只要样本点的密度大于某阈值,则将该样本添加到最近的簇中。 这类算法能克服基于距离的算法只能发现“类圆形”(凸)的聚类的缺点,可发现任意形状的聚类,且对噪声数据不敏感。但计算密度单元的计算复杂度大,需要建立空间索引来降低计算 阅读全文
摘要:
层次聚类方法 层次聚类方法对给定的数据集进行层次的分解,直到某种条件满足为止。具体又可分为: 1)凝聚的层次聚类:AGNES算法 一种自底向上的策略,首先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,直到某个终结条件被满足。 2)分裂的层次聚类:DIANA算法 采用自顶向下的策略, 阅读全文
摘要:
聚类的定义: 聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小,它是无监督学习。 聚类的基本思想: 给定一个有N个对象的数据集,构造数据的k个簇,k≤n。满足下列条件: 1. 每一个簇至少包含一个对象 2. 每一个对象属于且仅 阅读全文