2018年10月11日

DBSCAN聚类算法

摘要: 基本概念:(Density-Based Spatial Clustering of Applications with Noise)基于密度的噪声应用空间聚类 核心对象:若某个点的密度达到算法设定的阈值则其为核心点。(即r 邻域内点的数量不小于minPoints) ϵ-邻域的距离阈值:设定的半径r 阅读全文

posted @ 2018-10-11 15:23 医疗兵皮特儿 阅读(249) 评论(0) 推荐(0) 编辑

K-MEANS算法

摘要: 聚类概念: 无监督问题:我们手里没有标签了 聚类:相似的东西分到一组 难点:如何评估,如何调参 要得到簇的个数,需要指定K值 质心:均值,即向量各维取平均即可 距离的度量:常用欧几里得距离和余弦相似度(先标准化) 优化目标: Ci是质心,x是数据,质心到数据的距离 工作流程: 通过不断更新质心来确定 阅读全文

posted @ 2018-10-11 14:16 医疗兵皮特儿 阅读(245) 评论(0) 推荐(0) 编辑

导航