kNN总结

1,kNN不训练模型

2,主要是通过计算

3,计算点到每个近邻的距离,按照距离递增排序,选取距离最近的k个邻居,在k个邻居中出现频率最大的就是它的分类结果

4,计算距离有不同的距离公式,可以看每种公式计算下来的区别

http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.DistanceMetric.html#sklearn.neighbors.DistanceMetric

5,kNN工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。

6,优点:精度高、对异常值不敏感、无数据输入假定

      缺点:计算复杂度高、空间复杂度高

      适用数据范围:数值型和标称型

http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html#sklearn.neighbors.KNeighborsClassifier

 

我也是初学者,如果有人看到这篇文章的话,有什么问题可以在下面留言,我们可以交流

posted @ 2018-06-04 09:02  你爱谈天我爱笑  阅读(138)  评论(0编辑  收藏  举报