上一页 1 ··· 22 23 24 25 26 27 28 29 30 ··· 41 下一页
  2010年9月4日
摘要: 源代码下载作者:finallyliuyu 转载使用等请注明出处笔者按:此系列博文仅对于Libsvm二分类做入门性的介绍,并非研究libsvm的专业水准文章。至于如何用libsvm进行回归,多分类,笔者目前还没有涉及,请您查阅libsvm的相关文档说明。这里给出文本预处理模块(Python语言编写);调用libsvm进行文本分类模块采用C语言编写;实验结果处理模块(Matlab)用此份代码做的实验:... 阅读全文
posted @ 2010-09-04 14:30 finallyly 阅读(5274) 评论(6) 推荐(1) 编辑
摘要: 画图和计算结果准确率的matlab代码Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/--%matrix横坐标featureDimension,纵坐标N_corpusfeatureDimension=[10,20,30,40,50,60,70,80,90,... 阅读全文
posted @ 2010-09-04 10:47 finallyly 阅读(2047) 评论(0) 推荐(0) 编辑
摘要: 作者:finallyliuyu 转载使用等请注明出处 首先介绍libsvm 中主要的文件svm.h,svm.c ,这个两个文件实现了svm的算法。 svm-train.c,svm-predict.c 分别完成训练和预测功能。 本来我参照svm-train,svm-predict中的 main函数,将train功能,和predict功能直接在程序中整合,结果,调了一天都有异常。。(我还是太菜了)... 阅读全文
posted @ 2010-09-04 10:44 finallyly 阅读(5656) 评论(1) 推荐(1) 编辑
摘要: 作者:finallyliuyu 转载使用等请注明出处功能:根据:档集合大小,特征词数目,交叉验证折数的不同需求,快速生成Libsvm格式数据数据Demo请见:新闻文本分类libsvm格式数据预处理部分的框架图此模块的各个子模块的功能我就不详细介绍了,与此系列博客K-means文本聚类系列(已经完成) 一曲同工。下面开始给出各个子模块的代码:文档集分割:多少篇文章归为训练集,多少篇文章归为测试集:注... 阅读全文
posted @ 2010-09-04 10:19 finallyly 阅读(6934) 评论(4) 推荐(2) 编辑
摘要: 感觉自己涉入算法研究的时间太少了。好比一头拉磨的驴子,一直在纠结于一些细枝末节的技术。从C# 跑到Python,然后又回归C++,完全是在原地转了一个很大的圈圈。目前已经确定自己要学习C++语言,将在自己的实验框架都搭在C++语言平台上,这样就可以集中精力攻关一门语言了,不用C#会一点,Python会一点,却都是小半瓶水的水平了。近期还打算写三个系列的偏技术性质的博客,1。libsvm分类,包括文... 阅读全文
posted @ 2010-09-04 09:08 finallyly 阅读(492) 评论(5) 推荐(0) 编辑
  2010年9月3日
摘要: 注意: 本代码中没有实现“C++工程调用weka”的功能,如果您要找这类的资料,那么您来错地方了。重申一下这份代码的目的:方便广大自然语言处理爱好者,研究者,不必过分究竟于编程的技术细节,而是能在一开始就将注意力集中在文本分类/聚类这个主题上。 拿我自己做个比方吧,我一直怀疑课本上所讲的各种特征词选择方法是否有效,比如课本上说DF法与IG法,CHI squire法效果差不多... 阅读全文
posted @ 2010-09-03 21:29 finallyly 阅读(3139) 评论(10) 推荐(2) 编辑
摘要: 作者:finallyliuyu 转载使用等请注明出处上一讲:Kmeans文本聚类之VSM模型 中,给出了如何建立文档向量模型,以及写weka软件所要求的数据格式arff的代码。这里我们将介绍从weka中获取聚类中心,完成聚类的代码。至于如何用weka聚类,该软件使用说明等之类问题,本系列博客不做介绍,请大家自行google之。我们找到我们已经写好的arff文件: 点击start,出现结果后,单击鼠... 阅读全文
posted @ 2010-09-03 20:27 finallyly 阅读(9930) 评论(5) 推荐(3) 编辑
摘要: 语料数据库实验结果以及中间数据文本预处理开源框架源代码头文件: 阅读全文
posted @ 2010-09-03 19:58 finallyly 阅读(12252) 评论(18) 推荐(2) 编辑
摘要: 作者:finallyliuyu 转载使用等请注明出处在上一篇博文《Kmeans聚类之特征词选择DF》中我们已经给出了特征词选择的代码,这里我们将给出建立文档向量模型的代码,以及将文档向量模型写成Weka数据格式的代码。关于Weka数据格式等相关内容,请见:教程。首先我们给出写Arff头文件的代码下面重点介绍采用TF-IDF权重建立文档向量模型:在给出代码之前先简要介绍下什么是TF,DF对于一个特定... 阅读全文
posted @ 2010-09-03 19:18 finallyly 阅读(9635) 评论(24) 推荐(3) 编辑
摘要: 在Visual C++中用ADO进行数据库编程由 wnchg 整理  1. 生成应用程序框架并初始化OLE/COM库环境   创建一个标准的MFC AppWizard(exe)应用程序,然后在使用ADO数据库的InitInstance函数中初始化OLE/COM库(因为ADO库是一个COM DLL库)。本例为:程序最后要调用 ::CoUninitialize();//释放程序占用的COM 资源。另外... 阅读全文
posted @ 2010-09-03 11:44 finallyly 阅读(2277) 评论(0) 推荐(0) 编辑
上一页 1 ··· 22 23 24 25 26 27 28 29 30 ··· 41 下一页