K-邻近算法

K-邻近算法

采用测量不同特征值之间的距离来进行分类
Ad：精度高，对异常值不敏感，无数据输入假定
Na：计算复杂度高，空间复杂度高

KNN原理

存在样本集，每个数据都存在标签，输入无标签的新数据后，算法提取出特征最相似的标签。
一般选取前K个数据，通常K不大于20，最后选择K个最相似的数据中出现次数最多的分类，作为新数据的分类标签。

适用

数值型和标称型

算法流程

收集数据
any method
准备数据
计算距离数值，最好为格式化的数据
分析数据
any method
训练算法
不适用KNN算法
测试算法
计算错误率
使用算法
实际应用

posted @ 2016-12-09 22:36 John95 阅读(138) 评论(0) 编辑收藏举报

刷新页面返回顶部