kNN总结

1，kNN不训练模型

2，主要是通过计算

3，计算点到每个近邻的距离，按照距离递增排序，选取距离最近的k个邻居，在k个邻居中出现频率最大的就是它的分类结果

4，计算距离有不同的距离公式，可以看每种公式计算下来的区别

http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.DistanceMetric.html#sklearn.neighbors.DistanceMetric

5，kNN工作原理：存在一个样本数据集合，也称作训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据（最近邻）的分类标签。

6，优点：精度高、对异常值不敏感、无数据输入假定

缺点：计算复杂度高、空间复杂度高

适用数据范围：数值型和标称型

http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html#sklearn.neighbors.KNeighborsClassifier

我也是初学者，如果有人看到这篇文章的话，有什么问题可以在下面留言，我们可以交流

posted @ 2018-06-04 09:02 你爱谈天我爱笑阅读(138) 评论(0) 编辑收藏举报

刷新页面返回顶部

你爱谈天我爱笑