摘要: 搜索广告搜索广告就是一个典型的Ad Network,但是搜索广告非常重要,它的收入非常高,所以它有其独特之处,复杂度也比展示广告要高。它与展示广告在点击率预测,检索部分差不多,它的特点:1.用户定向标签f(u):远远弱于上下文影响,一般可以忽略,但是因为搜索广告中query的信息已经很强了,用que... 阅读全文
posted @ 2015-06-30 16:30 94julia 阅读(377) 评论(0) 推荐(0) 编辑
摘要: 探索与利用(Explore and exploit)点击率预测中还有一个重要的问题,就是探索与利用,它在工程中解决的并不好,我这章把现在论文中的常见的几种方法介绍一下。探索与利用它是所有互联网应用都要面对的一个问题,形式化一些,可以解释为:整体的效果是无法通过采样得到的,因为观察到的数据只是投放过的... 阅读全文
posted @ 2015-06-30 16:29 94julia 阅读(449) 评论(0) 推荐(0) 编辑
摘要: 动态特征特征对点击率预测有多种选择的方法,我们现在有三个轴,有ad,user,context。User上有很多标签,cookie,age,gender是从定向信息中得到的,url上有一些域名和分析得到的topic,ad上有层次的category,advertiser,campaign,solutio... 阅读全文
posted @ 2015-06-30 16:26 94julia 阅读(941) 评论(0) 推荐(0) 编辑
摘要: 逻辑回归优化方法-L-BFGS逻辑回归的优化方法是一个经典的问题,如果我们把它视为一个最大熵模型,那么我们知道最早的优化方法是IIS,这个方法就不细讲了,因为它速度很慢。后来发现在最优化领域中非常常用的l-BFGS方法对于Logistic Regression的收敛速度优化是不错的。l-BFGS方法... 阅读全文
posted @ 2015-06-30 16:25 94julia 阅读(1551) 评论(0) 推荐(0) 编辑
摘要: 点击率预测和逻辑回归点击率预测从广告索引中我们得到很多的广告候选,这些广告从逻辑上都满足广告主的定向条件,即广告主定向条件的DNF范式,在竞价广告系统中,我们要选择一个最优的方案,最优的广告投送出来,一般最优的广告是通过eCpm进行排序,用广义第二高价进行排序,进行收费的模式。在CPC环境中eCpm... 阅读全文
posted @ 2015-06-30 14:00 94julia 阅读(1802) 评论(0) 推荐(0) 编辑
摘要: ZooKeeper介绍为了讲述的完整性,介绍一下ZooKeeper。ZooKeeper在Index和Ad Server里使用比较多,虽然它可能没有google的Chubby好,但它是开源的工具。举一个使用场景,比如我们有很多台Index,或者有很多台Ad Server,其中有一些机器崩溃了,或是有一... 阅读全文
posted @ 2015-06-30 13:53 94julia 阅读(440) 评论(0) 推荐(0) 编辑
摘要: 流量预测在前面合约式广告中提到过合约式广告中有三个基本技术,1.受众定向,2.点击预测,3.流量预测。在这三个技术基础上才可以做Online Allocation,本节主要介绍流量预测。在定向条件分的比较粗的情况下,流量预测是比较简单的,比如只对人群分了几十个类,那么只需要进行简单的统计就可以进行流... 阅读全文
posted @ 2015-06-30 13:50 94julia 阅读(1773) 评论(0) 推荐(2) 编辑
摘要: 广告检索在前面谈到合约式广告时没有讨论广告检索的问题,虽然合约式广告也有检索的问题,但合约式广告一般数量非常小,只有千的级别,不需要特别的检索技术。但在广告网络中,比如google的广告数在百万级别。广告的检索问题有其独特的地方,下面我们讨论两点。1.布尔表达式检索,2.长Query,它在上下文广告... 阅读全文
posted @ 2015-06-30 13:46 94julia 阅读(1374) 评论(0) 推荐(0) 编辑
摘要: 广告网络广告网络(Ad Network)在竞价机制下,主流的广告市场形态是广告网络,解释一下,广告网络在竞价机制下这个说法并不准确,因为广告网络是一个很庞杂的概念,有按CPD(按天付费)广告,还有合约式广告等等,我这里我们暂时只关注竞价机制下的广告网络。Wiki中对广告网络的定义,Connects ... 阅读全文
posted @ 2015-06-30 13:44 94julia 阅读(767) 评论(0) 推荐(0) 编辑
摘要: 位置拍卖理论竞价系统理论竞价广告是在线广告发展的一个里程碑,竞价广告不能认为是从合约式广告发展而来的,竞价广告的发展是独立的,它是在Targeting技术发展到一定程度后,必然的一个选择,比如Bluekai加工的标签非常细,非常多,它已经无法按标签分别签合约了,那么只能让广告主自己去选择标签购买,但... 阅读全文
posted @ 2015-06-30 12:08 94julia 阅读(1233) 评论(0) 推荐(0) 编辑
摘要: 数据加工和交易因为有受众定向,CTR会提高,那么就产生了市场价值,所以市场就产生了数据的加工和交易。一些公司有数据,但它们不一定能数据变现的能力,也不一定对数据变现的业务有接口,那么就会产生数据的交易。精准广告业务是什么?精准广告业务可以类比于提炼汽油的过程。炼油第一步是从油田中抽取原油,原油在炼油... 阅读全文
posted @ 2015-06-30 12:02 94julia 阅读(476) 评论(0) 推荐(0) 编辑
摘要: 注:这一节我忽略,如果今后有时候,我会整理一份Topic Model的资料来说明,因为原课程中面向的是可能本来就熟悉Topic Model的听众,讲这课只是举个例子,带大家复习一下,所以即使整理出来,意义也不大。最主要的一个原因是原PPT中没有Topic Model的公式,我认为离开了公式,真的无法... 阅读全文
posted @ 2015-06-30 12:00 94julia 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 上下文定向它是f(c)的标签,它与行为定向相似,也是对用户打标签,但它所打的是一个即时标签,但实现它的系统,是不可能做到实时的,我称它为一个Near-line的系统,意思是接近实时的系统。要对上下文打标签,需要一个Key是URL,Value是特征的Cache。广告投放系统就通过URL从这个Cache... 阅读全文
posted @ 2015-06-30 11:58 94julia 阅读(835) 评论(0) 推荐(0) 编辑
摘要: 行为定向行为定向(Behavioral Targeting)行为定向是前节所前到的f(u)的定向方式,它是对user打标签。用户的哪些行为可以对行为定向有贡献,业界也有一些讨论,我这里列出是的九种类型(按信息强度排序):1. Transaction,交易行为,对效果广告来说它是最强的信号,这也就是淘... 阅读全文
posted @ 2015-06-30 11:49 94julia 阅读(1650) 评论(0) 推荐(0) 编辑
摘要: 受众定向概念中国互联网用户桌面受众定向是指按人群来划分对广告的售卖和优化,它是在线广告中最核心的部分。受众定向是在线广告区别于线下广告最本质的部分。这是我前两天打开计算机后,离开之后,回来之后我把广告拉开后桌面的样子。可以看到广告已经完全占据了我的桌面。我举这个例子是想说:在中国无论广告还是内容都是... 阅读全文
posted @ 2015-06-30 11:46 94julia 阅读(2003) 评论(0) 推荐(0) 编辑
摘要: HadoopHadoop概况Hadoop由Apache Software Foundation公司于2005年秋天作为Lucene的子项目Nutch的一部分正式引入。它受到最先由Google Lab开发的Map/Reduce和Google File System(GFS)的启发。Yahoo!是最主要... 阅读全文
posted @ 2015-06-30 11:33 94julia 阅读(632) 评论(0) 推荐(0) 编辑
摘要: 在线分配(Online Allocation)问题在线分配问题前面提到过广告是三方博弈,用户,广告主,媒体之间的博弈,而推荐系统是用户与媒体的博弈。它们之间的区别其一是广告主通媒体reach用户是有量的需求的,推荐系统是自己把内容推给用户,不见得有明显的量的需求。广告的量的需求体现在两个方面,一种是... 阅读全文
posted @ 2015-06-30 11:10 94julia 阅读(2257) 评论(0) 推荐(0) 编辑