算法入门系列2：k近邻算法

用官方的话来说，所谓K近邻算法(k-Nearest Neighbor，KNN)，即是给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的K个实例（也就是上面所说的K个邻居），

这K个实例的多数属于某个类，就把该输入实例分类到这个类中。这是一个有监督的学习算法

例如下图，红色和蓝色代表已知的训练好的的数据，这个时候来一个示例，也就是图中的绿色圆块，这个绿色圆块属于哪一类呢？

KNN算法中，所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

KNN 算法本身简单有效，它是一种 lazy-learning 算法，分类器不需要使用训练集进行训练，训练时间复杂度为0。

KNN 分类的计算复杂度和训练集中的文档数目成正比，也就是说，如果训练集中文档总数为 n，那么 KNN 的分类时间复杂度为O(n)。

posted @ 2016-04-27 17:43 2BiTT 阅读(246) 评论(0) 编辑收藏举报

刷新页面返回顶部

2BiTT