摘要:
Searching the Web (Arvind Arasu etc.) 1. 概述 2000年,23%网页每天更新,.com域内网页40%每天更新。网页生存半衰期是10天。描述方法可用Poisson过程。 28%的网页构成强连通核心,22%处于核心的上游,22%处于核心的下游,其他的部分无法互联 阅读全文
摘要:
Learning to Personalize Query Auto-Completion 样本 正例用用户的sug点击,其余是负例 特征 用户历史特征: query历史频次,候选和用户历史输入的ngram相似度 历史分短期(同一个session),长期(所有历史) 人口特征: 分年龄搜索频次,性别 阅读全文