摘要: 一、模型概念 支持向量机的模型基本模型是建立在特征空间上的最大间隔线性分类器,通过使用核技巧,可以使它成为非线性分类器。 当训练数据线性可分时,通过硬间隔最大化,学习一个线性分类器,即线性可分支持向量机;当训练数据近似线性可分时,通过软间隔最大化,学习一个线性分类器,即软间隔支持向量机;当训练数据线 阅读全文
posted @ 2018-04-06 16:55 hugh_tan 阅读(191) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2018-04-01 16:40 hugh_tan 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 随机森林 对数据样本及特征随机抽取,进行多个决策树训练,防止过拟合,提高泛化能力 <!--5f39ae17-8c62-4a45-bc43-b32064c9388a:W3siYmxvY2tUeXBlIjoicGFyYWdyYXBoIiwic3R5bGVzIjp7ImFsaWduIjoibGVmdCIs 阅读全文
posted @ 2018-04-01 15:11 hugh_tan 阅读(521) 评论(0) 推荐(0) 编辑
摘要: 神经网络反向传播 首先理解一个基础前提,神经网络只是一个嵌套的,非线性函数(激活函数)复合线性函数的函数。对其优化,也同一般机器学习算法的目标函数优化一样,可以用梯度下降等算法对所有函数参数进行优化。 但因为前馈神经网络的函数嵌套关系,对其优化求偏导时,存在一个沿着网络反方向的链式关系。 以一个两个 阅读全文
posted @ 2018-03-27 11:21 hugh_tan 阅读(193) 评论(0) 推荐(0) 编辑
摘要: 训练集 用来训练模型参数的数据 验证集 根据训练集的训练参数,在此验证数据集上的表现结果,人为调节超参数的数据,并选出最优超参数 测试集 人为调节超参数后,最终测试选择最优模型及超参数的表现 阅读全文
posted @ 2018-03-26 16:40 hugh_tan 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 设A为n阶矩阵,若存在常数λ及n维非零向量x,使得Ax=λx,则称λ是矩阵A的特征值,x是A属于特征值λ的特征向量。 根据定义可改写为关系式 , 为单位矩阵(其形式为主对角线元素为λ- ,其余元素乘以-1)。要求向量 具有非零解,即求齐次线性方程组 有非零解的值 。即要求行列式 。 解次行列式获得的 阅读全文
posted @ 2018-03-18 20:04 hugh_tan 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 一、卡方分布 若k个独立的随机变量Z1,Z2,⋯,Zk,且符合标准正态分布N(0,1),则这k个随机变量的平方和,为服从自由度为k的卡方分布。 卡方分布之所以经常被利用到,是因为对符合正态分布的随机变量的处理过程中,很容易出现其平方和的统计量。 正如在卡方检验问题中出现这个统计量一样自然。 二、卡方 阅读全文
posted @ 2018-03-18 16:36 hugh_tan 阅读(1130) 评论(0) 推荐(0) 编辑