摘要: 本文目的 weka是一套使用java开发的数据挖掘工具集合,提供GUI/CLI界面和Java API使用方式。所以,在学习和解决数据挖掘问题时,可以先尝试用weka的GUI或CLI做出合适的分析,找到适当的算法,然后在将此算法集成到自己的项目中。最近在的项目中遇到了文本聚类的问题,kmeans是一种常见的聚类算法,这里先拿此算法和示例数据做一些实验,以便熟悉weka的界面操作。 什么是k... 阅读全文
posted @ 2012-10-15 21:12 bourneli 阅读(24247) 评论(3) 推荐(1) 编辑
摘要: 首先,下载SCWS源代码按照下面的方式安装scws(scws可以作为独立工具使用,也可以作为动态库,在C/C++程序中调用,也可以作为php扩展在php语言中调用)bzip2 -d SCWS_1.X.X.tar.bz2tar xvf SCWS_1.X.X.tar./configure --prefix=SCWS_HOMEmake make installPS:上述操作完成后,scws已经安装成功,可以以命令行方式或在C/C++程序中使用SCWS命令行方式使用SWCScd SCWS_HOME./scws -i ../etc/test.txt -o ../etc/out.txt -r ../etc 阅读全文
posted @ 2012-10-15 20:20 bourneli 阅读(5244) 评论(0) 推荐(0) 编辑
摘要: 工欲善其事必先利其器,学习数据挖掘,没有好的工具,估计举步维艰。下面是在网上上调研的一些数据挖掘工具,详细情况,参考链接中的内容: http://voyagememoirs.com/pharmine/2008/05/18/summary/ http://wenku.baidu.com/view/5cea1f906bec0975f465e2ab http://wenku.baid... 阅读全文
posted @ 2012-10-15 19:45 bourneli 阅读(567) 评论(0) 推荐(0) 编辑