上一页 1 ··· 3 4 5 6 7 8 下一页
摘要: 《集体智慧编程》关于婚介数据集的SVM分类转自:http://muilpin.blog.163.com/blog/static/165382936201131875249123/作者写这本书的年代已经很久远了,于是里面使用到的LIBSVM接口与现在也非常不一样:1.书本上提高的官方下载svm已经更新至3.x版本,不适合(研究了很久,发现接口很大不一样,建议阅读者不要使用最新版本,如果实在需要请参考本文第4点)2.网上有人用libsvm2.89在Python2.6成功。(一定要libsvm2.89搭配python2.6,其他版本都不能成功,我就是浪费了大量时间在这里!)两步:1.将libsvm- 阅读全文
posted @ 2013-08-01 16:00 无脚的鸟 阅读(3578) 评论(0) 推荐(0) 编辑
摘要: 算法,全排列,全组合, 位操作,移位 阅读全文
posted @ 2013-07-30 18:23 无脚的鸟 阅读(24502) 评论(3) 推荐(3) 编辑
摘要: libsvm 用SVM实现简单线性分类(转自:http://www.cnblogs.com/freedomshe/archive/2012/10/09/2717356.html)0. 下载libsvm压缩包解压到本地目录(from:http://www.csie.ntu.edu.tw/~cjlin/libsvm/index.html)1. 新建JAVA工程,导入libsvm包及其源码2. 编写测试代码,使用libsvm函数进行分类预测3. 参考贴一、新建JAVA工程,导入libsvm包及其源码。 1. 新建JAVA工程及主函数main后,右键工程=>build path=>conf 阅读全文
posted @ 2013-07-26 20:23 无脚的鸟 阅读(849) 评论(0) 推荐(0) 编辑
摘要: 分词 阅读全文
posted @ 2013-07-25 11:31 无脚的鸟 阅读(726) 评论(0) 推荐(0) 编辑
摘要: linux hadoop 阅读全文
posted @ 2013-07-12 11:16 无脚的鸟 阅读(389) 评论(0) 推荐(0) 编辑
摘要: 电影推荐 简单版本 阅读全文
posted @ 2013-06-15 10:56 无脚的鸟 阅读(3821) 评论(0) 推荐(1) 编辑
摘要: 习题 6-19:(信息检索导论) 计算查询digital cameras及文档digital cameras and video cameras的向量空间相似度并 将结果填入表6-1的空列中。假定N=10 000 000(总文档个数=N),对查询及文档中的词项权重(wf对应的列) 采用对数方法计算,查询的权重计算采用idf,而文档归一化采用余弦相似度计算。将 and 看成 是停用词。请在tf列中给出词项的出现频率,并计算出最后的相似度结果。 表6-1 习题6-19中的余弦相似度计算 又题目可知:查询q:digital cameras 某文档:digit... 阅读全文
posted @ 2013-06-04 11:36 无脚的鸟 阅读(1101) 评论(0) 推荐(0) 编辑
摘要: 韩家炜 数据挖掘概念与技术 第三版 习题3.12取鸢尾花数据集iris.data作为待离散化的数据集合,使用ChiMerge算法,对四个数值属性进行离散化,对四个属性进行区间合并,最终合并区间个数剩下为6个即停:即max_interval=6。一、样本数据iris.data数据形式为:前面4列是属性,最后一列是数据类名,5.1,3.5,1.4,0.2,Iris-setosa4.9,3.0,1.4,0.2,Iris-setosa4.7,3.2,1.3,0.2,Iris-setosa6.6,2.9,4.6,1.3,Iris-versicolor5.2,2.7,3.9,1.4,Iris-versic 阅读全文
posted @ 2013-05-30 17:01 无脚的鸟 阅读(3331) 评论(0) 推荐(0) 编辑
摘要: NB模型概率估计很差,但分类效果很好。朴素贝叶斯是产生模型,所以是要求联合概率的。建立 NB分类器有两种不同的方法:一种多项式NB模型,它在文档的每个位置上生成词表中的一个词项。(推荐使用)另外一种方法是多元贝努利模型(multivariate Bernoulli model)或者直接称为贝努利模型 。(该模型常出错,不推荐使用)小规律小结小结1:贝叶斯模型里,只要是求条件概率:p(x|y) ,即是已知隐变量类别y条件下 求可见变量x的概率 一般是可直接一步得出, 从训练集求得的,用词频相除即可求。小结2:多项式模型 P(d|c) = P(<t1, …, tk , … , tnd > 阅读全文
posted @ 2013-05-23 21:56 无脚的鸟 阅读(2221) 评论(0) 推荐(1) 编辑
摘要: 因子分析(还没有完全弄透)一、总结:因子分析其实就是降维。 (详细笔记见--斯坦福机器学习讲义: 因子分析笔记) 强烈建议回看因子分析其实就是认为高维样本点实际上是由低维样本 点经过高斯分布、线性变换、误差扰动生成的,因此高维数据可以使用低维来表示。因子分析是对应无监督学习问题,因为用到EM算法,还是有EM算法的,E步都是求出隐性变量Z,而z表示可能的类别,所以凡是有EM算法的,一定是无监督学习.什么情况下用因子分析:之前我们考虑的训练数据中样例x(i)的个数m都远远大于其特征个数n,这样不管是进 行回归、聚类等都没有太大的问题。然而当训练样例个数 m 太小,甚至 m<<n 的时候 阅读全文
posted @ 2013-05-20 08:30 无脚的鸟 阅读(2364) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 下一页