摘要: DBSCAN算法 基本概念:(Density-Based Spatial Clustering of Applications with Noise) 核心对象:若某个点的密度达到算法设定的阈值则其为核心点。(即 r 邻域内点的数量不小于 minPts) ε-邻域的距离阈值:设定的半径r 直接密度可 阅读全文
posted @ 2018-07-21 01:25 理想几岁 阅读(1232) 评论(0) 推荐(0) 编辑
摘要: 层次聚类 层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法。 作为一家公司的人力资源部经理 阅读全文
posted @ 2018-07-21 00:52 理想几岁 阅读(37056) 评论(6) 推荐(5) 编辑
摘要: 一、聚类 聚类分析是非监督学习的很重要的领域。所谓非监督学习,就是数据是没有类别标记的,算法要从对原始数据的探索中提取出一定的规律。而聚类分析就是试图将数据集中的样本划分为若干个不相交的子集,每个子集称为一个“簇”。它的难点是不好调参和评估。下面是sklearn中对各种聚类算法的比较。 二、K-Me 阅读全文
posted @ 2018-07-21 00:35 理想几岁 阅读(1036) 评论(0) 推荐(0) 编辑