随笔分类 - 机器学习
摘要:下载的libsvm包里面已经为我们编译好了(windows)。进入libsvm\windows,可以看到这几个exe文件: a.svm-toy.exe:图形界面,可以自己画点,产生数据等。 b.svm-scale.exe:对特征值进行缩放。 c.svm-train.exe:接收特定格式的输入,产生一
阅读全文
摘要:1、libsvm数据格式 libsvm使用的训练数据和检验数据文件格式如下: label 目标值,就是说class(属于哪一类),就是你要分类的种类,通常是一些整数。 index 是有顺序的索引,通常是连续的整数。就是指特征编号,必须按照升序排列 value 就是特征值,用来train的数据,通常是
阅读全文
摘要:libsvm中有进行参数调优的工具grid.py和easy.py可以使用,这些工具可以帮助我们选择更好的参数,减少自己参数选优带来的烦扰。 所需工具:libsvm、gnuplot 本机环境:Windows7(64 bit) ,Python3.5 1、相关程序的下载和安装: 1.1、下载libsvm,
阅读全文
摘要:LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietik?inen, 和D. Harwood 在1994年提出,用于纹理特征提取。而且,提取的特征是图像的局部的纹理特
阅读全文
摘要:Adaboost算法结合Haar-like特征 一、Haar-like特征 目前通常使用的Haar-like特征主要包括Paul Viola和Michal Jones在人脸检测中使用的由Papageorgiou C首先提出的原始矩形特征和Rainer Lienhart 和 Jochen Maydt提
阅读全文
摘要:朴素贝叶斯分类器 一、贝叶斯定理 (1)条件概率: P(A|B)表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为: (2)贝叶斯公式: P(B|A)是根据A参数值判断其属于类别B的概率,称为后验概率。P(B)是直接判断某个样本属于B的概率,称为先验概率
阅读全文
摘要:决策树之C4.5算法 一、C4.5算法概述 C4.5算法是最常用的决策树算法,因为它继承了ID3算法的所有优点并对ID3算法进行了改进和补充。 改进有如下几个要点: C4.5算法选择决策属性的度量标准是增益比率gain ratio(Quinlan 1986)。增益比率度量是用前面的增益度量Gain(
阅读全文
摘要:一,什么是BP "BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学
阅读全文
摘要:主要内容 一:SVM简介 二:线性分类 三:分类间隔 四:核函数 五:松弛变量 SVM简介 支持向量机(support vector Machine)是由Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学
阅读全文