随笔分类 - Machine Learning
学习machine learning的一些笔记和程序
摘要:KNN是最简单的分类方法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。参考,http://www.cnblogs.com/biyeymyhjob/archive/2012/07/24/2607011.htmlhttp://blog.csdn.net/aladdina/article/details/4141127(网上的参考基本上都跟这两个一样,这两个也基本一样)由于KNN方法
阅读全文
摘要:在OpenCV Maching Learning部分,实现了一些经典的机器学习算法,并且每个算法都有相应的例子,所以我觉得可以从这里开始学习机器学习算法。K-means算法应该是比较简单的机器学习算法,就先从这个开始学习。K-means 算法是很典型的基于距离的聚类算法 。从二维图像的例子来看,图像上有很多个点,为了将这些点按他们相近的距离分成一簇一簇的,假设要分成k簇,k-means算法步骤如下,a. 随机地选取k个点作为中心,b. 计算每个点到这些中心的距离,将这个点归属于离它最近的中心,这样就得到了k个簇。因为是随机选取的中心,会有一些点分配到错误的中心上。c. 根据得到的簇重新计算出它
阅读全文