2018年7月10日
摘要: Searching the Web (Arvind Arasu etc.) 1. 概述 2000年,23%网页每天更新,.com域内网页40%每天更新。网页生存半衰期是10天。描述方法可用Poisson过程。 28%的网页构成强连通核心,22%处于核心的上游,22%处于核心的下游,其他的部分无法互联 阅读全文
posted @ 2018-07-10 20:49 冰山上的博客 阅读(168) 评论(0) 推荐(0) 编辑
摘要: Learning to Personalize Query Auto-Completion 样本 正例用用户的sug点击,其余是负例 特征 用户历史特征: query历史频次,候选和用户历史输入的ngram相似度 历史分短期(同一个session),长期(所有历史) 人口特征: 分年龄搜索频次,性别 阅读全文
posted @ 2018-07-10 18:53 冰山上的博客 阅读(847) 评论(0) 推荐(0) 编辑