摘要: **全文检索(Full-text Search)**:即先建立索引,再对索引进行搜索(倒排索引)。索引是从非结构化数据中提取出之后重新组织的信息。 ![lucene的一般过程.png](https://segmentfault.com/img/remote/1460000021695249) 全文检 阅读全文
posted @ 2020-12-23 14:55 打了鸡血的女汉子 阅读(168) 评论(1) 推荐(1) 编辑
摘要: 1.最近邻检索(Nearest Neighbor Search) 最近邻检索就是根据数据的相似性,从数据库中寻找与目标数据最相似的项目。这种相似性通常会被量化到空间上数据之间的距离,可以认为数据在空间中的距离越近,则数据之间的相似性越高。 k最近邻(K-Nearest Neighbor,K-NN)检 阅读全文
posted @ 2020-12-23 14:51 打了鸡血的女汉子 阅读(916) 评论(1) 推荐(1) 编辑
摘要: 一、语义匹配 1.1基于特征表示 1.1.1DSSM 1.1.2CNN-DSSM 1.1.3LSTM-DSSM 1.1.4Bert 1.2.基于交互 1.2.1ARC-ii 1.2.2MatchPyramid 1.2.3Match-SRNN 1.2.4Bert 1.3.改进方向 1.4传统语义匹配模 阅读全文
posted @ 2020-12-23 11:49 打了鸡血的女汉子 阅读(2284) 评论(1) 推荐(1) 编辑
摘要: 文档搜索梳理 搜索引擎 一个基本的搜索系统大体可以分为离线挖掘和在线检索两部分,其中包含的重要模块主要有:Doc内容理解、Query理解、检索召回、排序模块等。整个检索系统的目标可以抽象为给定query,检索出最能满足用户需求的Doc 1.1离线挖掘 在离线侧,需要做一些基础的离线挖掘工作,包括Do 阅读全文
posted @ 2020-12-23 11:48 打了鸡血的女汉子 阅读(408) 评论(1) 推荐(1) 编辑