笨兔勿应

2017年2月26日

摘要：首先，对于支持向量机（SVM）的简单总结： 1. Maximum Margin Classifier 2. Lagrange Duality 3. Support Vector 4. Kernel 5. Outliers 6. Sequential Minimal Optimization 详细的理阅读全文

posted @ 2017-02-26 13:36 笨兔勿应阅读(4079) 评论(0) 推荐(0) 编辑

2017年2月12日

FTRL与Online Optimization

摘要： 1. 背景介绍最优化求解问题可能是我们在工作中遇到的最多的一类问题了：从已有的数据中提炼出最适合的模型参数，从而对未知的数据进行预测。当我们面对高维高数据量的场景时，常见的批量处理的方式已经显得力不从心，需要有在线处理的方法来解决此类问题。在CTR预估中，经常会用到经典的逻辑回归（LR），而对L 阅读全文

posted @ 2017-02-12 15:47 笨兔勿应阅读(2364) 评论(0) 推荐(0) 编辑

2017年2月11日

CTR预估中的贝叶斯平滑方法（一）原理及实验介绍

摘要： 1. 背景介绍广告形式：互联网广告可以分为以下三种： 1）展示广告（display ad） 2）搜索广告（sponsored search ad） 3）上下文广告（contextual ad）竞价模式：对于在线广告，主要有以下几种竞价模式： 1）pay-per-impression（按展示付阅读全文

posted @ 2017-02-11 15:26 笨兔勿应阅读(23884) 评论(2) 推荐(3) 编辑

2017年2月2日

A Practical Guide to Support Vector Classication

摘要：《A Practical Guide to Support Vector Classication》是一篇libSVM使用入门教程以及一些实用技巧。 1. Basic Kernels：（1）linear （2）polynomial （3）radial basis function （4）sigm 阅读全文

posted @ 2017-02-02 20:25 笨兔勿应阅读(481) 评论(0) 推荐(0) 编辑

2017年1月9日

Practical Lessons from Predicting Clicks on Ads at Facebook

摘要： ABSTRACT 这篇paper中作者结合GBDT和LR，取得了很好的效果，比单个模型的效果高出3%。随后作者研究了对整体预测系统产生影响的几个因素，发现Feature（能挖掘出用户和广告的历史信息）+Model（GBDT+LR）的贡献程度最大，而其他因素（数据实时性，模型学习速率，数据采样）的影响阅读全文

posted @ 2017-01-09 10:29 笨兔勿应阅读(7162) 评论(1) 推荐(0) 编辑

2017年1月8日

Learning Query and Document Similarities from Click-through Bipartite Graph with Metadata

摘要：读了一篇paper，MSRA的Wei Wu的一篇《Learning Query and Document Similarities from Click-through Bipartite Graph with Metadata》。是关于Ranking Relevence方面的文章。下面简单讲下我对阅读全文

posted @ 2017-01-08 16:15 笨兔勿应阅读(846) 评论(0) 推荐(0) 编辑

2017年1月1日

Click Models for Web Search(2) - Parameter Estimation

摘要：在Click Model中进行参数预估的方法有两种：最大似然（MLE）和期望最大（EM）。至于每个click model使用哪种参数预估的方法取决于此model中的随机变量的特性。如果model中的随机变量都是可以observed，那么无疑使用MLE，而如果model中含有某些hidden vari 阅读全文

posted @ 2017-01-01 22:36 笨兔勿应阅读(927) 评论(0) 推荐(0) 编辑

2016年12月27日

Click Models for Web Search(1) - Basic Click Models

摘要：这篇文章主要是介绍一些基本的click model，这些不同的click model对用户与搜索结果页的交互行为进行不同的假设。为了定义一个model，我们需要描述出observed variables，hidden variables，以及它们之间的关联，以及它们对model parameter 阅读全文

posted @ 2016-12-27 21:54 笨兔勿应阅读(3152) 评论(1) 推荐(0) 编辑

2016年12月25日

LSA，pLSA原理及其代码实现

摘要：一. LSA 1. LSA原理 LSA(latent semantic analysis)潜在语义分析，也被称为 LSI(latent semantic index)，是 Scott Deerwester, Susan T. Dumais 等人在 1990 年提出来的一种新的索引和检索方法。该方法和阅读全文

posted @ 2016-12-25 17:24 笨兔勿应阅读(20208) 评论(3) 推荐(1) 编辑

公告