摘要: 首先,对于支持向量机(SVM)的简单总结: 1. Maximum Margin Classifier 2. Lagrange Duality 3. Support Vector 4. Kernel 5. Outliers 6. Sequential Minimal Optimization 详细的理 阅读全文
posted @ 2017-02-26 13:36 笨兔勿应 阅读(4051) 评论(0) 推荐(0) 编辑
摘要: 1. 背景介绍 最优化求解问题可能是我们在工作中遇到的最多的一类问题了:从已有的数据中提炼出最适合的模型参数,从而对未知的数据进行预测。当我们面对高维高数据量的场景时,常见的批量处理的方式已经显得力不从心,需要有在线处理的方法来解决此类问题。 在CTR预估中,经常会用到经典的逻辑回归(LR),而对L 阅读全文
posted @ 2017-02-12 15:47 笨兔勿应 阅读(2337) 评论(0) 推荐(0) 编辑
摘要: 1. 背景介绍 广告形式: 互联网广告可以分为以下三种: 1)展示广告(display ad) 2)搜索广告(sponsored search ad) 3)上下文广告(contextual ad) 竞价模式: 对于在线广告,主要有以下几种竞价模式: 1)pay-per-impression(按展示付 阅读全文
posted @ 2017-02-11 15:26 笨兔勿应 阅读(23528) 评论(2) 推荐(3) 编辑
摘要: 《A Practical Guide to Support Vector Classi cation》是一篇libSVM使用入门教程以及一些实用技巧。 1. Basic Kernels: (1)linear (2)polynomial (3)radial basis function (4)sigm 阅读全文
posted @ 2017-02-02 20:25 笨兔勿应 阅读(477) 评论(0) 推荐(0) 编辑
摘要: ABSTRACT 这篇paper中作者结合GBDT和LR,取得了很好的效果,比单个模型的效果高出3%。随后作者研究了对整体预测系统产生影响的几个因素,发现Feature(能挖掘出用户和广告的历史信息)+Model(GBDT+LR)的贡献程度最大,而其他因素(数据实时性,模型学习速率,数据采样)的影响 阅读全文
posted @ 2017-01-09 10:29 笨兔勿应 阅读(7137) 评论(1) 推荐(0) 编辑
摘要: 读了一篇paper,MSRA的Wei Wu的一篇《Learning Query and Document Similarities from Click-through Bipartite Graph with Metadata》。是关于Ranking Relevence方面的文章。下面简单讲下我对 阅读全文
posted @ 2017-01-08 16:15 笨兔勿应 阅读(845) 评论(0) 推荐(0) 编辑
摘要: 在Click Model中进行参数预估的方法有两种:最大似然(MLE)和期望最大(EM)。至于每个click model使用哪种参数预估的方法取决于此model中的随机变量的特性。如果model中的随机变量都是可以observed,那么无疑使用MLE,而如果model中含有某些hidden vari 阅读全文
posted @ 2017-01-01 22:36 笨兔勿应 阅读(922) 评论(0) 推荐(0) 编辑
摘要: 这篇文章主要是介绍一些基本的click model,这些不同的click model对用户与搜索结果页的交互行为进行不同的假设。 为了定义一个model,我们需要描述出observed variables,hidden variables,以及它们之间的关联,以及它们对model parameter 阅读全文
posted @ 2016-12-27 21:54 笨兔勿应 阅读(3140) 评论(1) 推荐(0) 编辑
摘要: 一. LSA 1. LSA原理 LSA(latent semantic analysis)潜在语义分析,也被称为 LSI(latent semantic index),是 Scott Deerwester, Susan T. Dumais 等人在 1990 年提出来的一种新的索引和检索方法。该方法和 阅读全文
posted @ 2016-12-25 17:24 笨兔勿应 阅读(20088) 评论(3) 推荐(1) 编辑