搜索引擎之全局架构
搜索引擎的基本架构
基于文本匹配的搜索引擎
1. TF-IDF 算法
TF-IDF来源于一个“古老”且经典的信息检索模型,即:“向量空间模型”(Vector Space Model)。
2. BM25 算法
3. 语言模型
4. 单点法排序学习
5. 配对法排序学习
6. 列表法排序学习
7. 查询关键字理解-分类
8. 查询关键字理解-解析
9. 查询关键字理解-扩展
10. 文档理解-文档分类
11. 文档理解-文档聚类
12. 文档理解-多模文档分类
13. 语言模型(Language Model)
14. 语言模型(Language Model)
15. 语言模型(Language Model)
16. 语言模型(Language Model)