摘要: 在query-doc任务中,一般在召回层返回给我们一些文档(数量级在百),我们需要再对其进行排序返回跟query最相关的doc(数量级在十),第一阶段的召回传统做法是基于布尔查询的,当一个query中有多个term时,每个词对于文档的召回的贡献度是不一样的,我们不能一视同仁地看待这些term,常用做 阅读全文
posted @ 2020-12-19 21:37 打了鸡血的女汉子 阅读(473) 评论(2) 推荐(2) 编辑
摘要: 我们知道:语义匹配可分为两大类,基于表示的和基于交互的。 基于表示的:学习 query 和 doc ( 放在推荐里就是 user 和 item ) 的 representation 表示,然后通过定义 matching score 函数。 基于交互的:这种方法是不直接学习query和doc的语义表示 阅读全文
posted @ 2020-12-19 16:29 打了鸡血的女汉子 阅读(496) 评论(2) 推荐(2) 编辑
摘要: 小萌新最近实习碰到的第一个项目就是 搜索引擎,最近无论从模型还是从工程角度都苦读了很多知识,准备整理出来 帮助自己更好地理解。 一、Relevance Matching VS Semantic Matching 首先,这两个不是等价的哦! 1、Semantic Matching主要是强调语义上的匹配 阅读全文
posted @ 2020-12-19 14:52 打了鸡血的女汉子 阅读(196) 评论(1) 推荐(2) 编辑