摘要: 简单说明 这个算法主要工作是测量不同特征值之间的距离,有个这个距离,就可以进行分类了。 简称kNN。 已知:训练集,以及每个训练集的标签。 接下来:和训练集中的数据对比,计算最相似的k个距离。选择相似数据中最多的那个分类。作为新数据的分类。 python实例 # -*- coding: cp936 -*-#win系统中应用cp936编码,linux中... 阅读全文
posted @ 2014-06-10 22:08 程序员小王 阅读(153) 评论(0) 推荐(0) 编辑
摘要: 在python中使用这个函数库,可以将数据进行一系列的线性代数操作,非常方便。 下载Numpy函数库 windows 32位下载地址:http://sourceforge.net/projects/numpy/files/ 使用举例 random.rand(4,4) 产生一个4*4的随机数的数组,每一个数字都在0和1之间。注意是数组,不是矩阵。 ... 阅读全文
posted @ 2014-06-10 20:43 程序员小王 阅读(373) 评论(0) 推荐(0) 编辑
摘要: 今天刚刚开始接触机器学习。简单想一下自己理解的机器学习。在以往的计算机程序当中,主要还是由人自己来做选择,做决断。而在当下的环境之中,网络世界已经产生了庞大的数据,对于普通用户来说,可以说是信息过载了。而对于IT从业者来说,海量的数据(也就是在网上泛滥的大数据)恰恰是非常好的资源,可以用来分析用户的行为,从而让用户越来越懒,让用户产生对产品的依赖性,而达到留住用户,留住流量的的目的... 阅读全文
posted @ 2014-06-10 19:52 程序员小王 阅读(336) 评论(2) 推荐(0) 编辑