摘要:
用官方的话来说,所谓K近邻算法(k-Nearest Neighbor,KNN),即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。这是一个有监督的学习算法 例如下图,红色和蓝色代 阅读全文
摘要:
k-means是一种无监督学习算法,用于聚类。 下图(来自http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html)展示了k-means算法k=2时的聚类过程。 第一步:给定k个中心点,然后依次遍历所有数据点,计算每个数据点到k 阅读全文