理解机器为什么可以学习(一)---Feasibility of learning
摘要:主要讲解内容来自机器学习基石课程。主要就是基于Hoeffding不等式来从理论上描述使用训练误差Ein代替期望误差Eout的合理性。 PAC : probably approximately correct 一方面:根据PAC,针对一个h,Ein与Eout的差距很大的概率是很小的 另一方面:不能说直
阅读全文
Types of Learning
摘要:从四个角度大致总结一下不同类型的机器学习问题。 1. 按照输出空间的变化: 分类问题(二分类、多分类)、回归问题 2. 按照输出的标记变化: 监督学习 与 非监督学习 与 半监督学习(树的识别) 与 增强学习(训练宠物) 非监督学习又可以分为:分群问题、density estimation 、out
阅读全文
C++基础知识
摘要:项目需要用到c++,这段时间学一下,这里总结一些易错的基础知识。 1. gcc 与 g++的区别 vim下写好cpp程序后,cc之后编译错误,原因如下: 编译阶段是相同的,链接阶段g++默认链接c++库,gcc没有。所以一般情况下用gcc编译c文件,用g++编译cpp文件。但是也可以用gcc编译cp
阅读全文
Vim命令合集
摘要:1.模式切换 三种模式:命令模式,输入模式,底行模式 命令模式与输入模式之间的切换:i esc 命令模式与底行模式的切换:shift + : esc 2. 插入 i:在当前字符的左边插入 I:在当前行首插入 a:在当前字符的右边插入 A:在当前行尾插入 o:在当前行下面插入一个新行 O:在当前行上面
阅读全文
感知机算法
摘要:1. 感知机模型的引入 由信用卡发放问题引入感知机模型。假设现在有历史的信用卡发放数据,需要学习一个模型来,用来评判是否发放给一个新用户信用卡。 用户具有不同的特征,对这些特征加权得到一个分数,如果最终分数大于某个值,就发放,否则不发放。抽象为数学模型如下: 那么,我们就需要使用数学模型来学习这些加
阅读全文
【项目】搜索广告CTR预估(二)
摘要:项目介绍 给定查询和用户信息后预测广告点击率 搜索广告是近年来互联网的主流营收来源之一。在搜索广告背后,一个关键技术就是点击率预测 pCTR(predict the click-through rate),由于搜索广告背后的经济模型(economic model )需要pCTR的值来对广告排名及对点
阅读全文
【项目】搜索广告CTR预估(一)
摘要:本文介绍CTR相关基础知识。 一、广告投放系统 广告系统包含多个子系统。除了上图所示的广告投放系统外,还包含商业系统(广告库的获得),统计系统(点击展示日志的获得)等。 广告投放系统主要是面向用户的,交互逻辑就是用户请求一个网页之后,会想检索系统请求广告,然后检索系统从广告库中获取一个广告列表,进行
阅读全文
Kernel Logestic Regression
摘要:一、把 soft margin svm 看做 L2 Regression 模型 先来一张图回顾一下之前都学了些什么: 之前我们是通过拉格朗日乘子法来进行soft Margin Svm的转化问题,现在换一个思路: 好了,观察我们得到的这个没有条件的最小化问题: 这似乎和L2正则比较相似: 所以,可以把
阅读全文
SVM3 Soft Margin SVM
摘要:之前分为两部分讨论过SVM。第一部分讨论了线性SVM,并且针对线性不可分的数据,把原始的问题转化为对偶的SVM求解。http://www.cnblogs.com/futurehau/p/6143178.html 然后考虑到特征数量特别特别多的时候,引入核函数的求解。http://www.cnblog
阅读全文
Bias and Variance
摘要:以下内容参考 cousera 吴恩达 机器学习课程 1. Bias 和 Variance 的定义 Bias and Variance 对于改进算法具有很大的帮助作用,在bias和Variance的指引之下,我们可以有方向性的对算法进行改进。 模型较简单时,可能导致Bias,相反模型较为复杂的时候,容
阅读全文
SVM2---核函数的引入
摘要:前边总结了线性SVM,最终转化为一个QP问题来求解。后来又考虑到非线性SVM,如果特征特别特别多的话,直接使用QP的话求解不了,我们经过一系列的转化,把这一问题转化为训练集大小n量级的QP问题。 http://www.cnblogs.com/futurehau/p/6143178.html 在之前的
阅读全文
贪心题目汇总
摘要:Jump Game 贪心: 1 public boolean canJump(int[] nums) { 2 if (nums == null || nums.length == 0) { 3 return false; 4 } 5 int finalIndex = 0; 6 for (int i
阅读全文
SVM1 线性SVM
摘要:一、Linear Support Vector Machine 接下来的讨论假设数据都是线性可分的。 1.1 SVM的引入:增大对测量误差的容忍度 假设有训练数据和分类曲线如下图所示: 很明显,三个分类器都能够正确分类训练数据,但是哪一个的效果更好呢?直觉告诉我们第三个,为什么呢? 这是因为第三个的
阅读全文
Python画图
摘要:plt 离散点图 subplot: '-'就会拟合 1 import matplotlib.pyplot as plt 2 3 plt.plot(data['TV'], y, 'ro', label='TV') 4 plt.plot(data['Radio'], y, 'g^', label='Ra
阅读全文
基本指令
摘要:anaconda 中安装sklearn : conda install scikit-learn 查看安装的软件包及版本信息:pip list 或者 conda list 安装pip: 安装setup-tools pip install numpy老出现问题: 终于找到原因了。原因在于云主机1G内存
阅读全文