Interactive Search for One of the Top-k 阅读笔记

以下所有内容来自于论文: Interactive Search for One of the Top-k 

论文作者: Weicheng Wang, Raymond Chi-Wing Wong, Min Xie

1. 基本思想:

  1. 项目的目的是通过减少用户需要输入的数据量, 但是保证相对较好的结果

  2. 通过询问用户问题, 获取在询问的集合中通过获取局部最优值, 逼近全局最优解

  3. 在二维平面中通过2D-PI的算法进行计算, 在更高维度是通过HD-PI, RH进行计算

2. 相关论文:

  1. 对于是否需要用户进行能动地响应, 推荐算法被分为preference-based queriesinteractive queries

    1. preference-based queries:

      1. top-𝑘 query

      2. skyline query

      3. similarity query [4, 32]:

        通过寻找对象组之间的相似性进行推荐, 但是其前提是对象组已知以及对象之间的距离可测量

      4. regret minimizing query [10, 23, 25]

        通过定义一个regret ratio用于衡量用户基于该返回元组做出判断后的后悔水平, 找到一个推荐元组使得用户的后悔概率最小. 但是很难保证regret ratio和元组大小的同时较小

    2. user interaction queries:

      1. interactive skyline query: [2, 3, 18]

        通过与用户进行互动地信息获取, 减小推荐元组的大小, 但是其只学习了用户对于对象属性的偏好程度

      2. interactive similarity query: [5, 6, 31]

        通过学习query tupledistance function进行更好的预测. 但是需要训练的数据量很大, 而且需要用户对于推荐元组进行可量化的打分, 以此衡量推荐元组与最优元组之间的距离

      3. interactive regret minimizing query: [22]

        通过询问用户问题, 令其选择集合中最想要的对象进行建模. 但是其会伪造出一些不切实际的数据使用户感到被欺骗

        为了解决数据不切实际的问题 [36] 提出了UH-Simplex and UH-Random 算法使用数据库中的已有数据进行训练. 但是还是需要巨量的训练数据. 这两个算法在文献[40]中有改进函数:Sorting-Simplex 和 Sorting-Random. 虽然在思路上试图减小用户参与, 但是实际上效果不佳

      4. interactive preference learning:[15, 27]

        [27]提出Preference-Learning算法通过进行每对比较学习用户的preference信息. 但是由于其倾向于建立一个全局的描述函数, 而忽视了实际只需要推荐的K个项目总体较佳, 导致其用户参与量更大


      5. learning to rank [12, 14, 19, 21]

        [12, 19, 21]只是基于推荐元素之间的关系进行学习, 而没有基于一些内在规律 – 个人认为这里是使用统计学的一些定性参数

      6. 本文中的模型设计:

        1. 不需要用户提供显式的utility function

        2. 模型的目标是返回的目标是全局最优的K个目标之一

        3. 只使用真实数据进行推荐

        4. 对于用户交互的量要求较少




3. 问题定义:

  1. 问题的输入是一个大小为n的集合D, 集合中的元素是对象的特征向量, 特征向量的长度为d. 每个向量被认为是d维空间内的点

  2. 特征向量 p 的第 i 维度的值是 p[i] (𝑖 ∈ [1,𝑑] 且为整数), 且在处理本问题时认为 p[i] 被正则化到 (0,1] 区间之中, 且如果 p[i] 的值越大则意味着该对象的该维度的属性更加受到人们喜欢

  3. 对于用户的兴趣大小的函数(utility function)是一个对象的向量的各个维度的兴趣的加权和: f(p) = Σ(i from 1 to d) u[i]*p[i]. 也可以写成向量内积的形式: 𝑓 (𝑝) = 𝑢 · 𝑝 , 这里的f是一个从d维到1维的映射, 这里的权重向量u是一个d维度且每个维度大于零的向量 (为什么大于零: 因为已知f随p的任何一项的增大而增大, 所以系数大于零)

  4. u[i] 表示的是用户对于 p[i] 维度的感兴趣程度 (这里就和协同过滤的思路是一致的) 在本文中 u 被称为 utility vector, 并且将 v 的域称为 utility space

  5. 通过对对象的基本属性进行获取从而得到p, 然后对于u进行学习从而可以获得全局最优的k个解

  6. 由于对于u进行任意整数的数乘, 其最后得到的全局最优的k是不变的, 所以人为规定 u 的各个维度的和等于1, 所以 u 的空间是一个 d-1 维的可剖分空间 (例如, 当d = 2时, u[1] + u[2] = 1, 是一条一维的直线)

  7. 模型的目标是基于一个点集D, 返回一个点, 该点是用户全局的top k

  8. 模型获取信息的逻辑是在每一轮选取一对点作为问题提供给用户, 令其选择其更喜欢哪个, 并且尽可能地减少问题的数量

  9. 模型主要解决的问题以及其解决思路:

    1. 问题: 尽可能地减少提问的数量

    2. 解决理论: 对于任意一个大小为n的集合, 至少需要询问 log2(n/k) 个问题以获取一个位于全局topk中的点 由这里可以看出, 其基本思路是二分法的不完全搜索

    3. 简单证明: 对于一个集合D, 其中有 k-1 个点 q 使得 对于 p 中的任意维度, p[i] = q[i]. 所以可以证明至少需要 log2(n/k) 就可以获取 topk 元素





4. 二维下的算法:

  1. 𝑢[1] + 𝑢[2] = 1 -> 𝑓 (𝑝) = 𝑢[1]𝑝[1] + (1 − 𝑢[1])𝑝[2] -> 𝑓 (𝑝) = (𝑝[1] − 𝑝[2])𝑢[1] + 𝑝[2]

  2. 优化的目标是通过调整 𝑢[1] 使得 𝑓 (𝑝1) 和 𝑓 (𝑝2) 之间的大小关系和用户评价的大小关系一致

