Fork me on GitHub

LibSVM 安装使用

知道这个库已经很长的时间了,一直没有实践,以前也看过svm的理论,今天开始安装一下一直感觉有错误,结果自己傻了,根本没有错,可以直接使用。。。

libsvm参考资料:

libsvm下载网址:http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 
我的系统环境为 Win7 64bit + Matlab R2014a ,下载的是最新版的libsvm-3.22

具体流程

  • 下载: 
    从libsvm的主页下载合适的软件安装包,并解压,比如我解压到Matlab的Toolbox目录下,具体路径如下:....\Matlab\R2014b\toolbox
  • 设置Path: 
    在Matlab中依次选择设置路径-添加并包含子文件夹..,加入以上解压后存放的路径。
  • 编译: 
    事实上,对于64位的系统,我们是不需要进行编译的,自带的软件包中已经包含了对应于64位系统的编译好的文件:libsvmread.mexw64、libsvmwrite.mexw64、svmtrain.mexw64、svmpredict.mexw64,以上文件位于压缩包'..\windows'文件夹中。对于非64位系统,或者需要自己编译的特殊情况,采用如下de步骤编译自己的二进制文件。 
    • 在matlab中切换到解压后的libsvm-3.22\matlab目录(如我的系统为:...\Matlab\R2014b\toolbox\libsvm-3.20\matlab
    • 在命令窗口输入mex -setup ,此时会提示你选择编译器,就选择一个已安装的编译器,如Microsoft Visual C++ 2013。之后Matlab会提示确认选择的编译器,输入y进行确认。
    • 在命令窗口输入make,等待make完成,生成相应的后缀为mexw64(64位系统)或mexw32(32位系统)的文件。
    • 这里要说明,其实前一步的mex -setup并不是必须的,在make指令不奏效的时候调用一下即可;另外,在我的配置过程中,会提示有问题,大致如下所示, 其实并不需要在意,直接调用make 也会成功编译文件。

MEX 配置为使用 ‘Microsoft Visual C++ 2013 Professional (C)’ 以进行 C 语言编译。 
警告…您需要更新代码以利用新的 API。您可以在以下网址找到相关详细信息…

先一直没有看到类似的:

mex -setup
显示

Please choose your compiler for building external interface (MEX) files: 
 
Would you like mex to locate installed compilers [y]/n?

输入y
Select a compiler: 
[1] Lcc-win32 C 2.4.1 in D:\MATLAB\R2010a\sys\lcc 
[2] Microsoft Visual C++ 2008 SP1 in D:\Program Files\Microsoft Visual Studio 9.0 
[3] Microsoft Visual C++ 6.0 in D:\Program Files\Microsoft Visual Studio 
 
以为没有安装上,没有编译通过,结果是可以用的。load数据也有问题,路径不对:

有两个数据集,一个是C++的, 一个是matlab的。libsvm库中下载的是C++数据,

所以matlab加载我们下载的heart_scale是会报错的:<这就是视频中遗漏的小问题>

  • 重命名: 
    这并不是必须的操作,但鉴于个人的经验,建议执行。 
    编译完成后,在当前目录下回出现svmtrain.mexw64、svmpredict.mexw64(64位系统)或者svmtrain.mexw32、svmpredict.mexw32(32位系统)这两个文件,把文件名svmtrain和svmpredict相应改成libsvmtrain和libsvmpredict。 
    这是因为Matlab中自带有SVM的工具箱,而且其函数名字就是svmtrain和svmpredict,和libsvm默认的名字一样,在实际使用的时候有时会产生一定的问题,比如想调用libsvm的变成了调用Matlab SVM。 
    如果有进行重命名的,以后使用libsvm时一律使用libsvmtrain和libsvmpredict这两个名字进行调用。

特别补充:

以上是普通的libsvm在matlab 2014b 的设置,起初对于我而言,也是并不需要编译的,直接设置路径就可以使用libsvm,但是由于我需要使用对样本加权的训练方法,于是经过搜索,发现他们也是提供libsvm-weights-3.20版本的,参见这里,其中提供了Matlab和Python的接口,而并不存在已经编译好的文件,所以我需要进行编译并使用这一带权重的版本。

测试

以下测试是基于我配置的加权的libsvm的版本。 
libsvm软件包下的heart_scaleheart_scale.wgt文件分别提供了样本的label及feature信息和权重信息。要注意对于以上两个文件,其读取指令是不同的,以下将简单演示:在matlab命令窗口执行如下命令:

[heart_scale_label, heart_scale_inst] = libsvmread('heart_scale'); %读取方法
heart_scale_weight = load('heart_scale.wgt');
model = libsvmtrain(heart_scale_weight, heart_scale_label, heart_scale_inst, '-c 1'); %改名字了吧  +lib
[predict_label, accuracy, dec_values] = libsvmpredict(heart_scale_label, heart_scale_inst, model);

结果如下:

*
optimization finished, #iter = 166
obj = -107.553365, rho = 0.449867
nSV = 131, nBSV = 103
Total nSV = 131
Accuracy = 86.2963% (233/270) (classification)

特别的,对于不需要对样本考虑权重的情况,只需要修改训练的指令为:

model = libsvmtrain([], heart_scale_label, heart_scale_inst, '-c 1');

ok,以上就是对于Matlab 2014a使用libsvm(libsvm-weights)的简要记录。

 

svmtrain函数相关参数说明

svmtrain函数返回的model可以用来对测试数据集进行预测。这是一个结构体变量,主要包括了以下几个域。[Parameters, nr_class, totalSV, rho, Label, ProbA, ProbB, nSV,sv_coef, SVs]。英文说明如下:

       -Parameters: parameters

       -nr_class: number of classes; = 2 for regression/one-class svm

       -totalSV: total #SV

       -rho: -b of the decision function(s) wx+b

       -Label: label of each class; empty for regression/one-class SVM

       -ProbA: pairwise probability information; empty if -b 0 or in one-classSVM

       -ProbB: pairwise probability information; empty if -b 0 or in one-classSVM

       -nSV: number of SVs for each class; empty for regression/one-class SVM

       -sv_coef: coefficients for SVs in decision functions

       -SVs: support vectors

如果没有指定’-b 1’选项则ProbA和ProbB为空矩阵。此外,当指定’-v’选项时,返回的model是一个数值,是cross-validation的准确率。

其中model.paramter是一个5X1的向量,参数意义为:

model.Parameters参数意义从上到下依次为:

-s svm类型:SVM设置类型(默认0)

-t 核函数类型:核函数设置类型(默认2)

-d degree:核函数中的degree设置(针对多项式核函数)(默认3)

-g r(gama):核函数中的gamma函数设置(针对多项式/rbf/sigmoid核函数) (默认类别数目的倒数)

-r coef0:核函数中的coef0设置(针对多项式/sigmoid核函数)((默认0)

svmpredict函数参数说明

svmpredict函数返回三个值,predict_label,是训练集预测得到的label向量。第二个输出是accuracy,是一个3维的向量,从上到下分别是:分类准率(分类问题中用到的参数指标);平均平方误差(MSE (mean squared error))(回归问题中用到的参数指标);平方相关系数(r2 (squared correlation coefficient))(回归问题中用到的参数指标)。第三个输出是个矩阵,包含着决策值或者是概率估计(当’-b 1’被指定时)。当训练数据有k类时,决策值矩阵是一个n行k*(k-1)/2列的矩阵(n为测试数据集个数,k为类别数),而每一行的输出是k*(k-1)/2个二分类器的结果。当’-b 1’被指定时,概率估计矩阵是一个n行k类的矩阵(n为测试数据集个数,k为类别数),每一行的输出是该测试数据属于每个类的概率。

先试着学习,孰能生巧。。。

 

特别感谢:Matlab配置libsvm

              SVM学习笔记(1)LIBSVM在matlab下的使用安装

              LibSVM 在matlab中的使用

              LibSVM 在matlab中的配置(包括SVDD、libsvm-faruto)

posted @ 2016-12-23 20:15  ranjiewen  阅读(7535)  评论(0编辑  收藏  举报