竞价形势（Bid Landscape）预估总结

市场竞价预估

市场竞价预估的目标是预测每一次请求的市场价格，通常ADX和DSP都使用二价计费，因此市场价格也就是二价（计费价）。

准确地预测市场价格是一个重要的任务。对于ADX来说，每一次广告的请求的计费价都是可知的，因为可以轻易地用回归的方法拟合出。ADX可以用来预估每个DSP的竞价，从而选择要发送的DSP组合（比每次全部请求节约成本），还可以作为低价。但是对于DSP而言，只能获取到竞胜请求的计费价，对于竞价失败的请求，只能知道计费价比自己的竞价要高，这部分数据学术上称为删失数据，所以准确预测是十分困难的。

接下来总结关于模型的四个方法：

1. 只假设对数正态分布（2011 KDD）

参考文献：Bid landscape forecasting in online ad exchange marketplace

本文方法先用Fast-Correlation Based Filtering方法挑选出重要特征，然后提出了星树（star tree）结构存储每条样本的特征和竞价信息。除最后一层叶节点外，每一层表示一个特征，每个节点存储出现次数大于一定阈值的特征值，其余未出现的或次数较少的用星号（star）节点代替。最后一层的叶节点存储本条特征链路上的竞价数据的均值和方差。

上述特征树创建好之后，就相当于生成了一份新的数据集，然后用GBDT方拟合历史竞价，学习每条路径的特征和竞价信息的关系。

在线推理时，根据请求特征从树中寻找到最匹配的叶节点，取出期均值和方差。然后假设竞价服从对数正态分布，代入取到的均值和方差就可以计算出竞价预估值。对于广告活动粒度的预估，论文假设其为每个广告任务的混合分布（FMM），也就是将广告活动包含的样本预估结果进行聚合即可。

2. 假设正态分布+机器学习（2015 KDD）

参考文献：Predicting Winning Price in Real Time Bidding with Censored Data

总体思路：线性回归模型拟合竞胜数据，删失回归模型拟合竞输数据，实时竞价时使用两者混合后的模型。

2.1 线性回归模型拟合竞胜数据

表达式： $v_{i} \approx β^{T} x_{i} + ε_{i}$ ，注意，本文中的winning price表示市场价（计费二价）。

其中，下标 $i$ 表示样本序号； $v_{i}$ 是市场价； $β^{T} x_{i}$ 表示市场价的均值； $ε_{i}$ 假设服从均值为 $0$ ，方差为 $σ^{2}$ 的正态分布，用来学习删失信息。

2.2 删失回归模型拟合竞输数据

用上述公式拟合出竞胜均价之后，再用下述公式表示单次竞胜的概率：

P (v_{i} < b_{i}) = P (ε_{i} < (b_{i} - β^{T} x_{i})) = Φ (\frac{b_{i} - β^{T} x_{i}}{σ})

其中 $Φ$ 表示累计概率分布，最终实际计算时，还是使用逻辑回归改写了这个公式：

P (v_{i} < b_{i}) = \frac{1}{1 + e^{- β_{l r}^{T} x_{i}}}

2.3 损失函数

在竞胜数据上，损失函数目标是逼近市场价，最小化残差

在竞输数据上，公式表示竞胜概率，取负对数作为损失函数，也是最小此公式

2.4 在线预测

预测时，使用混合模型，竞胜率 * 竞胜均价 + 竞输率 * 竞输均价

3. 假设多个分布+深度学习（2018 KDD）

参考文献：[Deep Censored Learning of the Winning Price in the Real Time Bidding](https://github.com/notlate-cn/tech-blogs/blob/main/papers/Bidding Landscape/2018-Deep Censored Learning of the Winning Price in the Real Time Bidding.pdf)

与第2条是同一个作者，本文主要变动点：把原来的线性回归替换成通用函数 $g$ ，主要采用深度学习网络结构。

假设的分布用 $f$ 和 $F$ 表示，可以灵活替换成正态分布、对数正态分布和Gumbel分布。

4. 不假设任何分布，直接预估分布（2019 KDD）

参考文献：Deep Landscape Forecasting for Real-time Bidding Advertising

大致梳理一下论文思路，因为原论文中应该是有几处公式错误，可以参考文章《论文复现Deep Landscape Forecasting for Real-time Bidding Advertising》，本文推导的公式与论文和CSDN文章均略有差异。

4.1 生存分析法

本文基于生存分析法（KM）进行问题分析，可阅读文章进一步了解《KM生存曲线的原理及画法》。下面简述一下：

KM法是这样估计生存曲线：首先计算出活过一定时期的病人再活过下一时期的概率（即生存概率），然后将逐个生存概率相乘，即为相应时段的生存率。需要对观察对象一直持续保持关注，但是很难做到终生关注，中间可能会丢失。当观察到结束事件时（比如死亡）就停止记录，其中生存率常用 $S$ 表示。

则对应到市场竞价预估中，结束事件（比如死亡）用竞胜表示。因为竞胜后，就不需要继续分析后续出价范围了。同样的，生存事件则用竞输表示。所以生存率 $S = \prod_{每个周期} p_{竞输}$

4.2 在连续空间上表示竞胜率和竞输率

假设市场价（计费二价） $z$ 的分布概率密度函数为 $p (z)$ ，累积概率密度函数为 $P (z)$ ，出价为 $b$ 时：

竞胜率表示为： $W (b) = P (z < b) = \int_{0}^{b} p (z) d z$ ，含义是：当DSP的出价大于市场价时才能竞胜。
竞输率表示为： $S (b) = P (z \geq b) = 1 - W (b) = 1 - \int_{0}^{b} p (z) d z$

上述表示好理解，但是没法计算，接下来就把市场价离散化，重新表示。

4.3 在离散空间上表示竞胜率和竞输率

把出价离散化，可以用计费的最小单位（分）表示，例如： $0 = b_{0} < b_{1} < b_{2} < . . . < b_{l - 1} < b_{l}$ ，那么相邻两个价格组成的区间记为 $V_{0} = [b_{0}, b_{1}), V_{1} = [b_{1}, b_{2}), . . ., V_{l - 1} = [v_{l - 1}, v), V_{l} = [b_{l}, b_{l + 1})$ ，则：

新增定义市场价 $z$ 恰好落到价格区间 $V_{l}$ 的概率为： $p_{l} = P (z \in V_{l})$
竞胜率重新表示为： $W (b_{l}) = P (z < b) = \sum_{i = 0}^{l - 1} P (z \in V_{i})$
竞输率重新表示为： $S (b_{l}) = P (z \geq b) = 1 - W (b_{l}) = 1 - \sum_{i = 0}^{l - 1} P (z \in V_{i})$

综上可得：

\begin{matrix} (5) & p_{l} = P (z \in V_{l}) = W (b_{l + 1}) - W (b_{l}) = S (b_{l}) - S (b_{l + 1}) \end{matrix}

4.4 引入RNN

此时就可以把离线的竞胜率和竞输率转换成模型，然后使用三元组 $(x, b, z)$ 样本数据计算概率分布 $p (z)$ 。其中 $x$ 是输入特征， $b$ 为实际出价， $z$ 为市场价。当本次竞价获胜时， $z$ 为计费价；否则 $z$ 为0（因为竞输时，DSP拿不到计费价）。

但是目前 $p (z)$ 还是不好用模型结构表示，所以作者巧妙的构造了辅助变量来解决这个问题。

定义：在已知出价为 $b_{l - 1}$ 竞输的条件下，出价为 $b_{l}$ 时恰好获胜的概率为 $h_{l}$ ，则：

\begin{matrix} (6) & h_{l} = P (z \in V_{l - 1} | z \geq b_{l - 1}) \overset{贝 叶 斯 公 式}{=} \frac{P (z \in V_{l - 1}, z \geq b_{l - 1})}{P (z \geq b_{l - 1})} = \frac{P (z \in V_{l - 1})}{P (z \geq b_{l - 1})} = \frac{p_{l - 1}}{S (b_{l - 1})} \end{matrix}

其中 $z \geq b_{l - 1}$ 包含范围 $z \in V_{l - 1} = [b_{l - 1}, b_{l})$ ，其交集为 $z \in V_{l - 1}$ 。

由新的辅助变量可得：计算 $b_{l}$ 出价的恰好获胜概率只需要出价为 $b_{l - 1}$ 的竞输率和市场价格正好落在 $V_{l - 1}$ 的概率。所以引入RNN模型（本文使用的是LSTM结构），用 $f_{θ}$ 表示，则公式 $(6)$ 可改写为：

\begin{matrix} (7) & h_{l}^{i} = P (z \in V_{l - 1} | z \geq b_{l - 1}, x^{i} x^{i}; θ) = f_{θ} (x^{i} x^{i}, b_{l} | r_{l - 1} r_{l - 1}) \end{matrix}

公式 $(7)$ 的含义就是：在上一个出价区间竞输（ $r_{l - 1} r_{l - 1}$ ）的条件下，本次出价 $b_{l}$ 竞胜的概率，所以：

\begin{matrix} (7-1 本文作者补充) & r_{l - 1} r_{l - 1} = 1 - h_{l - 1}^{i} \end{matrix}

基于公式 $(6)$ 和 $(7)$ ，重写竞输率和竞胜率为公式 $(8)$ ：

\begin{aligned} S (b_{l} | x^{i} x^{i}; θ) & = P (z \geq b_{l} | x^{i} x^{i}; θ) \\ = P (z \notin V_{0}, z \notin V_{1}, z \notin V_{2}, . . ., z \notin V_{l - 1} | x^{i} x^{i}; θ) (8.1) \\ = P (z \notin V_{0} | x^{i} x^{i}; θ) * P (z \notin V_{1} | z \notin V_{0}, x^{i} x^{i}; θ) * P (z \notin V_{2} | z \notin V_{0}, z \notin V_{1}, x^{i} x^{i}; θ) * . . . * P (z \notin V_{l - 1} | z \notin V_{0}, x^{i} x^{i}, . . ., z \notin V_{l - 2}; θ) (8.2) \\ = 1 * P (z \notin V_{1} | z \geq b_{1}, x^{i} x^{i}; θ) * P (z \notin V_{2} | z \geq b_{2}, x^{i} x^{i}; θ) * . . . * P (z \notin V_{l - 1} | z \geq b_{l - 1}, x^{i} x^{i}; θ) (8.3) \\ = \prod_{k = 1}^{l - 1} P (z \notin V_{k} | z \geq b_{k}, x^{i} x^{i}; θ) (8.4) \\ = \prod_{k = 1}^{l - 1} (1 - P (z \in V_{k} | z \geq b_{k}, x^{i} x^{i}; θ)) (8.5) \\ = \prod_{k = 1}^{l - 1} (1 - h_{k + 1}^{i}) (8.6) \\ = \prod_{k = 2}^{l} (1 - h_{k}^{i}) (8.7) \\ = \prod_{k = 1}^{l} (1 - h_{k}^{i}) (8.8) \end{aligned}

上式 $(8.7) \to (8.8)$ 解释：当 $k = 1$ 时， $h_{1}^{i} = P (z \in V_{0} | z \geq b_{0}, x^{i} x^{i}; θ) = 1$ 。

\begin{aligned} W (b_{l}^{i} | x^{i} x^{i}; θ) & = 1 - S (b_{l}^{i} | x^{i} x^{i}; θ) \\ = 1 - \prod_{k = 1}^{l} (1 - h_{k}^{i}) (8.9) \end{aligned}

再由公式 $(6)$ 得到，对于第 $i$ 个样本来说， $z^{i}$ 正好落在区间 $V_{l - 1}$ 的概率为：

\begin{matrix} (9) & p_{l - 1}^{i} = h_{l}^{i} * S (b_{l - 1}^{i}) = h_{l}^{i} \prod_{k = 1}^{l - 1} (1 - h_{k}^{i}) \end{matrix}

4.5 损失函数

本文定义的损失函数形式类似于第3篇文章，采用了两种损失函数加权和的方式。

第一种方式是用市场价概率分布函数拟合竞胜数据。当已知给定的样本都是竞胜时，则优化目标可定义为最大化市场价 $z$ 恰好落在 $V_{l}$ 的概率，最好为 $1$ 。定义损失函数为负对数似然函数，则最小化以下公式即可：

\begin{aligned} L_{1} & = - \log (\prod_{x^{i} x^{i}, z^{i} \in D_{w i n}} P (z^{i} \in V_{l} | x^{i} x^{i}; θ)) \\ = - \log (\prod_{x^{i} x^{i}, z^{i} \in D_{w i n}} p_{l}^{i}) \\ = - \log (\prod_{x^{i} x^{i}, z^{i} \in D_{w i n}} (h_{l + 1}^{i} \prod_{k = 1}^{l} (1 - h_{k}^{i}))) \\ = - (\sum_{x^{i} x^{i}, z^{i} \in D_{w i n}} (\log h_{l + 1}^{i} + \log \prod_{k = 1}^{l} (1 - h_{k}^{i}))) \\ = - \sum_{x^{i} x^{i}, z^{i} \in D_{w i n}} (\log h_{l + 1}^{i} + \sum_{k = 1}^{l} \log (1 - h_{k}^{i})) \\ = - \sum_{x^{i} x^{i}, z^{i} \in D_{w i n}} (\log h_{l + 1}^{i} + \sum_{k : k \leq l} \log (1 - h_{k}^{i})) (10) \end{aligned}

第二种方式是用市场价累积概率分布函数同时拟合竞胜和竞输数据。对于竞胜数据，我们希望 $P (z^{i} < b_{l}^{i} | x^{i} x^{i}; θ) \to 1$ ，对于竞输数据，我们希望 $P (z^{i} \geq b_{l}^{i} | x^{i} x^{i}; θ) \to 1$ 。采用负对数似然函数定义损失函数如下：

\begin{aligned} L_{w i n} & = - \log (\prod_{x^{i} x^{i}, b^{i} \in D_{w i n}} P (z < b_{l}^{i} | x^{i} x^{i}; θ)) \\ = - \log (\prod_{x^{i} x^{i}, b^{i} \in D_{w i n}} W (b_{l}^{i} | x^{i} x^{i}; θ)) \\ = - \log (\prod_{x^{i} x^{i}, b^{i} \in D_{w i n}} (1 - \prod_{k = 1}^{l} (1 - h_{k}^{i}))) \\ = - \sum_{x^{i} x^{i}, b^{i} \in D_{w i n}} \log (1 - \prod_{k = 1}^{l} (1 - h_{k}^{i})) (11.1) \\ = - \sum_{x^{i} x^{i}, b^{i} \in D_{w i n}} \log (1 - \prod_{k : k \leq l} (1 - h_{k}^{i})) (11.2) \end{aligned}

\begin{aligned} L_{l o s e} & = - \log (\prod_{x^{i} x^{i}, b^{i} \in D_{l o s e}} P (z \geq b_{l}^{i} | x^{i} x^{i}; θ)) \\ = - \log (\prod_{x^{i} x^{i}, b^{i} \in D_{l o s e}} S (b_{l}^{i} | x^{i} x^{i}; θ)) \\ = - \log (\prod_{x^{i} x^{i}, b^{i} \in D_{l o s e}} (\prod_{k = 1}^{l} (1 - h_{k}^{i}))) \\ = - \sum_{x^{i} x^{i}, b^{i} \in D_{l o s e}} \log (\prod_{k = 1}^{l} (1 - h_{k}^{i})) \\ = - \sum_{x^{i} x^{i}, b^{i} \in D_{l o s e}} \sum_{k = 1}^{l} \log (1 - h_{k}^{i}) (12.1) \\ = - \sum_{x^{i} x^{i}, b^{i} \in D_{l o s e}} \sum_{k : k \leq l} \log (1 - h_{k}^{i}) (12.2) \end{aligned}

因为这两个损失函数是通过竞胜还是竞输区分的，所以作者设计了一个指示函数：

\begin{matrix} (13) & w^{i} = {\begin{cases} 1, i f b^{i} > z^{i}, \\ 0, o t h e r w i s e \end{cases} \end{matrix}

就可以把 $L_{w i n}$ 和 $L_{l o s e}$ 合并成：

\begin{aligned} L_{2} & = L_{w i n} + L_{l o s e} \\ = - \log (\prod_{x^{i} x^{i}, b^{i} \in D_{w i n}} P (z < b_{l}^{i} | x^{i} x^{i}; θ)) - \log (\prod_{x^{i} x^{i}, b^{i} \in D_{l o s e}} P (z \geq b_{l}^{i} | x^{i} x^{i}; θ)) \\ = - \log (\prod_{x^{i} x^{i}, b^{i} \in D} (W (b_{l}^{i} | x^{i} x^{i}; θ))^{w^{i}} (1 - W (b_{l}^{i} | x^{i} x^{i}; θ))^{1 - w^{i}}) (14.1) \\ = - \sum_{x^{i} x^{i}, b^{i} \in D} (w^{i} \log (W (b_{l}^{i} | x^{i} x^{i}; θ)) + (1 - w^{i}) \log (1 - W (b_{l}^{i} | x^{i} x^{i}; θ))) (14.2) \end{aligned}

最终的损失函数为：

\begin{matrix} (15) & \underset{θ}{a r g m i n} α L_{1} + (1 - α) L_{2} \end{matrix}

公式实在太多了，可累坏了。

posted @ 2025-02-09 13:06 稳住·能赢阅读(26) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET：高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· DeepSeek “源神”启动！「GitHub 热点速览」
· 上周热点回顾（2.17-2.23）

稳住·能赢

讲人话，都能懂。

竞价形势（Bid Landscape）预估总结

市场竞价预估

1. 只假设对数正态分布（2011 KDD）

2. 假设正态分布+机器学习（2015 KDD）

2.1 线性回归模型拟合竞胜数据

2.2 删失回归模型拟合竞输数据

2.3 损失函数

2.4 在线预测

3. 假设多个分布+深度学习（2018 KDD）

4. 不假设任何分布，直接预估分布（2019 KDD）

4.1 生存分析法

4.2 在连续空间上表示竞胜率和竞输率

4.3 在离散空间上表示竞胜率和竞输率

4.4 引入RNN

4.5 损失函数

公告

搜索

最新随笔

合集 (3)

随笔分类 (24)

随笔档案 (24)

文章分类 (6)

文章档案 (6)

阅读排行榜