11 2014 档案
摘要:逻辑回归(Logistic Regression)是机器学习中十分常用的一种模型,属于广义线性模型。在互联网领域得到了广泛的应用,尤其是在广告系统中用来估计CTR。本文主要介绍逻辑回归的模型形式,求解策略和算法。接着介绍逻辑回归的最大似然估计,最后说明为什么逻辑回归要采用sigmoid函数做变换。模...
阅读全文
摘要:本文主要从一个例子开始说说线性回归模型以及线性回归模型的损失函数,求解方法和概率解释。不涉及统计学里的回归分析等诸多细节。例子假设我们中介手上有一些房屋销售的数据(北京的房价太高了):面积(平方米)价格(万)8032090365100380120400150500有个人有个130平方米的房子要卖,中...
阅读全文
摘要:推荐系统是近几年比较火的一个话题,尤其是Netflix举办过一次电影推荐比赛之后,ACM有专门的Recommer System的会议。关于推荐系统的分类,从不同的角度有不同的分法,传统的有两种分法,一种叫基于内容(Content based)的推荐,顾名思义就是根据要推荐的项目(电影,书籍,音乐等等...
阅读全文
摘要:感知机(Perceptron)是二类分类的线性分类模型,是SVM和神经网络的基础。感知机以一个实数值向量作为输入,计算这些输入的线性组合,如果结果大于某个阈值就输出+1,否则输出-1。下面就从模型,策略和算法三方面来说说这个模型,最后会推导一下算法的收敛性。模型感知机模型为:$\large h(\m...
阅读全文
摘要:本文主要通过一个典型的例子介绍什么是机器学习以及机器学习里常见的一些概念。例子一个顾客想申请招商银行信用卡,招商银行让这个顾客填写一些基本资料,假设整个申请表一共只有五项(真实的申请表会被这五个选项要多得多)。性别女年龄23工作年限0.5年收入10万负债1万假如你是招商银行信用卡负责人,你会给她发放...
阅读全文
摘要:本文主要介绍概率与数理统计中的一些常见的基本概念。样本空间对于随机试验,尽管在每次试验之前不能预知试验的结果,但是试验的所有可能结果集合是已知的,我们将随机试验E的所有可能的结果组成的集合称为E的样本空间,记为S。样本空间的的元素,即E的每个可能结果,称为样本点。比如事件E:抛一枚硬币,观察正面H,...
阅读全文