yyyyyyyyyyyyyyyyyyyy

博客园 首页 新随笔 联系 订阅 管理

机器学习十大算法之KNN算法

前段时间一直在搞tkinter,机器学习荒废了一阵子。如今想重新写一个,发现遇到不少问题,不过最终还是解决了。希望与大家共同进步。

闲话少说,进入正题。

KNN算法也称最近邻居算法,是一种分类算法。

算法的基本思想:假设已存在一个数据集,数据集有多个数值属性和一个标签属性,输入一个新数据,求新数据的标签。

步骤如下:

  1. 先将新数据拷贝n份,形成一个新的数据集;

  2. 逐行计算新数据集与原数据集的距离;

  3. 按距离长度排序后,统计前K个数据里,那个标签出现的次数最多,新数据就标记为哪个标签。

算法如下:

posted on 2016-11-27 22:31  xxxxxxxx1x2xxxxxxx  阅读(218)  评论(0编辑  收藏  举报