午夜稻草人

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

1.编写代码的方式

只需要在java工程中导入weka.jar和sqlite-jdbc-3.8.7.jar两个jar包, weka.jar可以在weka的安装路径下找到, sqlite-jdbc-3.8.7.jar下载路径http://download.csdn.net/detail/gjh460293451/8371289

然后编写测试代码:

import weka.classifiers.Classifier;
import weka.classifiers.trees.J48;
import weka.core.Instances;
import weka.core.converters.DatabaseLoader;

public class Test1 {

    public static void main(String[] args) throws Exception {
        Classifier m_classifier = new J48();
        try {
            DatabaseLoader loader = new DatabaseLoader();
            //sqlite数据库文件位置,用户名密码可以空
            loader.setSource("jdbc:sqlite://D:/work/preload/new_data/SampleInfo.db", "", "");
            //查询语句
            loader.setQuery("select * from SampleInfo");

            Instances instancesTrain = loader.getDataSet(); // 读入训练文件
            //用 "pkgname" 作为分类属性,设置分类属性列 
                instancesTrain.setClassIndex(10);
            int sum = instancesTrain.numInstances(); //数据条数
            System.out.println("data number :" + sum);
//            System.out.println(instancesTrain);
            double right = 0.0f;
            m_classifier.buildClassifier(instancesTrain); // 训练  

            for (int i = 0; i < sum; i++)// 测试分类结果
            {
                if (m_classifier.classifyInstance(instancesTrain.instance(i)) == instancesTrain
                        .instance(i).classValue())// 如果预测值和答案值相等(测试语料中的分类列提供的须为正确答案,结果才有意义)
                {
                    right++;// 正确值加1
                }
            }
            System.out.println("J48 classification precision:" + (right / sum));  
        } catch (Exception e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }

}

结果输入为

data number :1631
J48 classification precision:0.592274678111588

2.通过GUI工具访问SQLite数据库文件

首先需要先添加sqlite-jdbc-3.8.7.jar到CLASSPATH

要正常访问数据库,根据计算机的实际情况正确修改配置文件是关键。Weka的配置文件名称为DatabaseUtils.props,位于weka.experiment包中。可以从weka.jar或weka-src.jar归档文件获取该配置文件。具体做法是,使用解压缩工具将归档文件解开,在weka/experiment子目录可以找到DatabaseUtils.props配置文件。本书直接在该配置文件的基础上进行修改。
为了方便用户,Weka对常用数据库都提供对应配置文件,在对应配置文件上进行修改要方便得多。例如:
(1) DatabaseUtils.props.hsql:适用HSQLDB 数据库;
(2) DatabaseUtils.props.msaccess:适用MS Access数据库;
(3) DatabaseUtils.props.mssqlserver:适用MS SQL Server 2000数据库;
(4) DatabaseUtils.props.mssqlserver2005:适用MS SQL Server 2005数据库;
(5) DatabaseUtils.props.mysql:适用MySQL数据库;
(6) DatabaseUtils.props.odbc:适用ODBC/JDBC桥连接的数据库;
(7) DatabaseUtils.props.Oracle:适用Oracle 10g数据库;
(8) DatabaseUtils.props.postgresql:适用PostgreSQL 7.4数据库;
(9) DatabaseUtils.props.sqlite3:适用sqlite 3.x数据库。

如下图所示: 这里写图片描述

(推荐)第一种方法比较简单,直接修改DatabaseUtils.props.sqlite3文件里面的URL路径到需要访问的db文件路径。

# database URL
jdbcURL=jdbc:sqlite://D:/work/preload/new_data/SampleInfo.db

然后打开Weka Explorer -->Open DB -->Switch database setup(第一行最右边的按钮) -->选择配置文件DatabaseUtils.props.sqlite3(注意File of Type: All Files)。 再点击第二个按钮尝试连接数据库,连接成功后,

Query部分写入sql语句, 点击execute,点击OK,加载数据成功。

(不推荐)另一种方法是修改weka.jar中的配置文件(weka/experiment/DatabaseUtils.props),替换成附件DatabaseUtils.props.sqlite3中的内容,同样注意修改URL路径,然后重新打包运行。

posted on 2017-04-20 21:10  午夜稻草人  阅读(844)  评论(0编辑  收藏  举报