The optimal choice of a subset of a population

原文:https://vanderbei.princeton.edu/tex/myPapers/OptimalChoice.pdf
原因:作为秘书问题的一个引申,如果不只是选一个最好的,而是选一组最好的呢?


1 intro

本文关注的最优子集(excellent set)记为D。在观察完所有的候选对象后,得到一个由excellent set决定的pay-off(不在excellent中的payoff是0)。如果给定一个n=2k,选择最优k个的例子,我们证明了这个例子中最大概率是1/(k+1).当n!=2k时,没有明确的解法。当n趋于正无穷,k固定时得到一个近似解。当n和k都趋于正无穷时,得到(2k-n)/sqrt(n)

当前候选对象比前面一些接受过的候选对象更好时就接受他这样一种策略称为admissible。还有一种情况,当前候选对象比之前接受过的任何一个对象都差,但是比之前拒绝过的都好。这种样本称为marginal样本。一个admissible策略决定于如何处理marginal样本。

假定在t时刻(t个样本已经被观测并且做了决定了),我们发现t+1样本是marginal。此时必须根据已经观察过的样本的排序和接受的情况来对t+1样本作出决策。不过这些信息中,我们只需要知道接受的和拒绝的样本的排序就行了。
这时我们要引入差值的概念来描述状态\(X_t\)=接受的样本数量-拒绝的样本数量。这样我们得到一个序列\(X_0=0, X_1,...,X_n\)。其中\(X_{t+1}-X_t\)=1,如果我们接受了t+1样本,或者=-1如果我们拒绝了t+1样本。
如果样本不是marginal的,我们做决策只需要考虑admissible就行了。
\(p_t(x)\)表示在t时刻,从状态x到x+1的概率;\(q_t(x)\)表示在t时刻,从状态x到x-1的概率。

2 可控马尔科夫链

我们假定表示观察候选对象顺序的n!个可能的排序的都是等概率的。这表示第一个t+1样本的相对顺序也是等概率的。

posted @ 2023-02-01 10:51  ijpq  阅读(9)  评论(0编辑  收藏  举报