knn算法是最近邻算法。直观的理解上,非常容易。为啥?就是在一批已知标签的训练集上,把一个测试集扔进去,根据与训练集的距离大小排列。距离最小的k个挑选出来,查看他们的标签类别。最多那个类别被视为该测试集的类。
怎么理解?假如要判断你喜欢什么运动。我先从和你走得最近的10个朋友入手。假如这10个朋友中,6个喜欢打篮球,2个喜欢打羽毛球,1个喜欢打网球,1个喜欢轮滑。那么我就判断你喜欢篮球。这实际上是很合理的。
posted on 2015-07-23 22:34 一动不动的葱头 阅读(208) 评论(0) 编辑 收藏 举报