【CSWS2014 Summer School】互联网广告中的匹配和排序算法-蒋龙（上）

Title:互联网广告中的匹配和排序算法

蒋龙博士，通联数据

Abstract:互联网广告是利用互联网提供的基础设施进行产品和服务营销的一种新形式，具有比传统广告方式更精准，成本收益更透明的优势。互联网广告是当今众多互联网企业实现价值变现的最主要形式之一，可以说，互联网广告产业是当今互联网能蓬勃发展的重要动力。

本次讲座将首先对互联网广告产业做一个简要的介绍，包括目前主流的几种广告模式，每种模式下主要的参与者及广告形态和特点。接下来分析几种主流广告模式中应用到的匹配和排序技术，包括搜索广告系统中的查询匹配算法，定向广告中的行为定向和个性化推荐技术，以及基于反馈数据的点击率预估系统。

Bio: 蒋龙，毕业于北京大学，现任通联数据首席数据科学家。曾任职于阿里巴巴集团，负责阿里妈妈事业部机器学习和排序，推荐和用户模型，基础算法和数据等团队。加入阿里之前曾任职微软亚洲研究院，从事自然语言处理、机器学习研究工作。主要感兴趣的领域包括机器学习，自然语言处理，互联网广告，量化投资等。

PS：以下照片并不包含全部PPT内容，仅包含个人感兴趣并认为有价值的PPT。

其中涉及的内容还是比较丰富的，但是不是十分详细，不过，大家可以从中了解一下工业界是如何解决一些实际问题的，同时能够了解一下我们所学的算法、模型是如何在实际中应用的。

Fig1，介绍了广告算法的基本策略，总结的很简单的两个步骤，也很容易理解。

Fig2，这幅图主要介绍了在搜索引擎广告系统（比如淘宝、京东、百度这种，你在搜索框输入Query[查询语句/词条]，系统显示结果）中涉及的角色，下面我对其中几个不易明白的内容进行解释说明。

广告主：“买词”的意思就是购买关键词，当用户搜索该关键词，那么就会优先推荐竞价高的广告主的广告；

　　　　“为点击付费”就是说用户只要点击过广告主的广告，无论最终是否进行了交易，广告主都要付给搜索引擎一定的费用；

搜索引擎：“Query分析”就是对用户输入的文本进行分析

　　　　“展示搜索结果+广告”也就是说既要保证用户体验，又要做到广告推荐。

Fig3，GSP的意思就是，竞价排行最高的广告主，只需要支付竞价排行第二的广告主所提出的价格，比如以前会有这种情况，A出了500W，B出了300W，当A得知自己最高的时候，会逐渐降低自己的出价，而GSP方法就可以有效的避免这种麻烦的情况出现。

其中有一个推广质量，这个数值是为了解决这种情况，举个比较极端的例子，广告主A是汽车公司，广告主B是服装公司，双方可以购买适合自己领域的词，但是有可能A购买了服装领域的词W并且竞价比B高，这时候W在A领域的推广质量定不如在B领域的推广质量，因此在关键词为W的广告排序的时候，不一定是A的在第一个，而且收费也会随之进行相应调整。