监督学习--k近邻算法

2017-07-20 15:18:25

k近邻(k-Nearest Neighbour, 简称kNN)学习是一种常用的监督学习方法,其工作机制非常简单,对某个给定的测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个‘邻居’的信息进行预测。一般来说,在分类中采用‘投票法’,即选择的这k个样本中出现最多的类别标记作为预测结果。

优点:精度高,对异常值不敏感,无数据输入假定;

缺点:计算复杂度高、空间复杂度高;(对每个输入测试样本,需要计算其和所有训练样本的距离,并从中选择k个最相近的)

适用的数据范围:连续型和离散型

 

posted @ 2017-07-20 19:02  hyserendipity  阅读(382)  评论(0编辑  收藏  举报