摘要: Clustering: An IntroductionWhat is Clustering?Clustering can be considered the most importantunsupervised learningproblem; so, as every other problem of this kind, it deals with finding astructurein a collection of unlabeled data.A loose definition of clustering could be “the process of organizing o 阅读全文
posted @ 2013-05-24 10:39 CY. 阅读(849) 评论(0) 推荐(0) 编辑
摘要: 最近在学习一些数据挖掘的算法,看到了这个算法,也许这个算法对你来说很简单,但对我来说,我是一个初学者,我在网上翻看了很多资料,发现中文社区没有把这个问题讲得很全面很清楚的文章,所以,把我的学习笔记记录下来,分享给大家。在数据挖掘中,k-Means 算法是一种cluster analysis的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。问题K-Means算法主要解决的问题如下图所示。我们可以看到,在图的左边有一些点,我们用肉眼可以看出来有四个点群,但是我们怎么通过计算机程序找出这几个点群来呢?于是就出现了我们的K-Means算法(Wikipedia链接)K-Mea 阅读全文
posted @ 2013-05-24 10:30 CY. 阅读(178) 评论(0) 推荐(0) 编辑