几个机器学习上的概念

KNN--k nearest neighbor algorithm

应用领域:KNN方法主要用于模式识别,是机器学习中最简单的一种学习方法。

思想:一个数据归为哪类,由最近的K个邻居投票,把它归为票数最多的类。这K个邻居取自已知数据。

要考虑的问题:选择那种距离--欧式距离,海明距离...

                    如何选择K值?

                    如何克服噪声的影响?

 

海明距离 Hamming Distance 

 两个相等长度的字符串,挨个比较每个字符,相同为0不相同为1,那么最后1的个数就是海明距离。

 

交叉验证 cross validation

这篇文章讲的比较通俗易懂 :http://www.cnblogs.com/galaxyprince/archive/2010/12/12/1903678.html

posted @ 2012-02-26 19:21  HOLD  阅读(270)  评论(0编辑  收藏  举报