2014 年 12月 4 日随笔档案 - JeromeBlog

2014年12月4日

Clustering by density peaks and distance

摘要：这次介绍的是Alex和Alessandro于2014年发表在的Science上的一篇关于聚类的文章[13]，该文章的基本思想很简单，但是其聚类效果却兼具了谱聚类(Spectral Clustering)[11,14,15]和K-Means的特点，着实激起了我的极大的兴趣，该聚类算法主要是基于两个基本点：1)聚类中心的密度高于其临近的样本点的密度;2)聚类中心与比其密度还高的聚类中心的距离相对较大.基于这个思想，聚类过程中的聚类中心数目可以很直观的选取，离群点也能被自动检测出来并排除在聚类分析外。无论每个聚类的形状是什么样的，或者样本点的维度是多少，聚类分析的结果都能令人很满意。下面我会主要基于这篇文章来详述该聚类算法的来龙去脉，并简单回顾下相关的聚类算法。最后,基于这篇文章思想,我最终用C++代码实现了一个比较完整的聚类算法,并作为我在GitHub上的first repository上传到了GitHub上面,有需要的请前往https://github.com/jeromewang-github/cluster-science2014下载,欢迎大家找出bug和提供修改意见! 阅读全文

posted @ 2014-12-04 20:22 JeromeBlog 阅读(4715) 评论(2) 推荐(0)

Jerome's Blog

What have you done today?