摘要:
这次介绍的是Alex和Alessandro于2014年发表在的Science上的一篇关于聚类的文章[13],该文章的基本思想很简单,但是其聚类效果却兼具了谱聚类(Spectral Clustering)[11,14,15]和K-Means的特点,着实激起了我的极大的兴趣,该聚类算法主要是基于两个基本点:1)聚类中心的密度高于其临近的样本点的密度;2)聚类中心与比其密度还高的聚类中心的距离相对较大.基于这个思想,聚类过程中的聚类中心数目可以很直观的选取,离群点也能被自动检测出来并排除在聚类分析外。无论每个聚类的形状是什么样的,或者样本点的维度是多少,聚类分析的结果都能令人很满意。下面我会主要基于这篇文章来详述该聚类算法的来龙去脉,并简单回顾下相关的聚类算法。最后,基于这篇文章思想,我最终用C++代码实现了一个比较完整的聚类算法,并作为我在GitHub上的first repository上传到了GitHub上面,有需要的请前往https://github.com/jeromewang-github/cluster-science2014下载,欢迎大家找出bug和提供修改意见! 阅读全文
最新评论
- 1. Re:Line Search and Quasi-Newton Methods
请问是哪本教材里的?
- --caogenwang
- 2. Re:Locally Weighted Regression
- 谢谢!
- --chaosink
- 3. Re:Matlab绘图高级部分
- 如何在直方图画不同图案?
- --lindexi
- 4. Re:Clustering by density peaks and distance
- 楼主你好。最近关注了下该分类方法,发现读入大块头数据以后,在clustering开始计算时,内存申请方面受到了局限。下面的代码 double** matrix=new double*[Num]; fo...
- --LameTurtle
- 5. Re:Line Search and Quasi-Newton Methods
- 写的很不错啊~持续关注
- --yyq90