随笔档案「2022年5月5日」：聚类--DBSCN ... - 朝南烟

2022年5月5日

摘要： 1、什么是DBSCN DBSCAN也是一个非常有用的聚类算法。它的主要优点:它不需要用户先验地设置簇的个数，可以划分具有复杂形状的簇，还可以找出不属于任何簇的点。 DBSCAN比凝聚聚类和k均值稍慢，但仍可以扩展到相对较大的数据集。 1.1算法原理 DBSCAN的原理是识别特征空间的“拥挤”区域中阅读全文

posted @ 2022-05-05 16:39 朝南烟阅读(445) 评论(0) 推荐(0)

聚类--凝聚聚类

摘要： 1、什么是凝聚聚类凝聚聚类（agglomerative clustering）指的是许多基于相同原则构建的聚类算法，这一原则是：算法首先声明每个点是自己的簇，然后合并两个最相似的簇，直到满足某种停止准则为止。 scikit-learn 中实现的停止准则是簇的个数，因此相似的簇被合并，直到仅剩下阅读全文

posted @ 2022-05-05 16:15 朝南烟阅读(341) 评论(0) 推荐(0)

聚类--KMeans

摘要： 1、什么是K均值聚类 k均值聚类是最简单也是最常用的聚类算法之一。它试图找到代表数据特定区域的簇中心（Cluster Center） K-means算法过程 1.随机布置K个特征空间内的点作为初始的聚类中心 2.对于根据每个数据的特征向量，从K个聚类中心中寻找距离最近的一个，并且把该数据标记为从属这阅读全文

posted @ 2022-05-05 15:53 朝南烟阅读(382) 评论(0) 推荐(0)

cly的园子

公告