摘要:
**全文检索(Full-text Search)**:即先建立索引,再对索引进行搜索(倒排索引)。索引是从非结构化数据中提取出之后重新组织的信息。 ![lucene的一般过程.png](https://segmentfault.com/img/remote/1460000021695249) 全文检 阅读全文
摘要:
1.最近邻检索(Nearest Neighbor Search) 最近邻检索就是根据数据的相似性,从数据库中寻找与目标数据最相似的项目。这种相似性通常会被量化到空间上数据之间的距离,可以认为数据在空间中的距离越近,则数据之间的相似性越高。 k最近邻(K-Nearest Neighbor,K-NN)检 阅读全文
摘要:
一、语义匹配 1.1基于特征表示 1.1.1DSSM 1.1.2CNN-DSSM 1.1.3LSTM-DSSM 1.1.4Bert 1.2.基于交互 1.2.1ARC-ii 1.2.2MatchPyramid 1.2.3Match-SRNN 1.2.4Bert 1.3.改进方向 1.4传统语义匹配模 阅读全文
摘要:
文档搜索梳理 搜索引擎 一个基本的搜索系统大体可以分为离线挖掘和在线检索两部分,其中包含的重要模块主要有:Doc内容理解、Query理解、检索召回、排序模块等。整个检索系统的目标可以抽象为给定query,检索出最能满足用户需求的Doc 1.1离线挖掘 在离线侧,需要做一些基础的离线挖掘工作,包括Do 阅读全文