摘要: 前言 定义: 在特征空间上间隔最大的线性分类器。 核是SVM非常重要的一个特性。 支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题。 分类 1》线性可分支持向量机 2》线性支持向量机 3》非线性支持向量机 如果训练数据线性可分,那么可以通过硬间隔最大化,学习一个线性分类器,就是线性可分支持向量机,就是硬间隔支持向量机。 类似,如果训练... 阅读全文
posted @ 2015-09-01 22:15 程序员小王 阅读(241) 评论(0) 推荐(0) 编辑
摘要: 前言 本章的两个模型都是对数线性模型。 逻辑斯蒂分布 如果变量X服从逻辑斯蒂分布,那么X的分布一定是y轴对称的。曲线在中心部分增长的较快。两端增长缓慢。 二项逻辑斯蒂回归模型 其本质就是条件概率P(Y|X)。也就意味着给定X,求出最大可能的Y来。 Y取值只有1和0。 考虑条件概率分布。 逻辑斯蒂回归模型:输出Y=1的对数几率是输出x的线... 阅读全文
posted @ 2015-09-01 19:43 程序员小王 阅读(445) 评论(0) 推荐(0) 编辑
摘要: 使用二叉搜索树可以节约搜索的时间。搜索某个节点的时间,等于该节点的深度+1。 希望文本中出现频繁的的单词和根节点较近,较少出现的单词最好能离根节点越远越好。 最优二叉搜索树的期望搜索代价最低。但是最优二叉搜索树的高度不一定是最矮的。 考虑搜索失败的问题。如果要搜索的值没有在二叉搜索树里面,就表示搜索失败。对不在二叉搜索树里面的值,需要使用虚叶子结点。 最优二叉... 阅读全文
posted @ 2015-09-01 09:34 程序员小王 阅读(261) 评论(0) 推荐(0) 编辑